12 galvenie padomi datu zinātnes apguvei

Autors: Laura McKinney
Radīšanas Datums: 3 Aprīlis 2021
Atjaunināšanas Datums: 15 Maijs 2024
Anonim
Centralizētā eksāmena latviešu valodā rezultāti 2019./2020.m.g. un ieteikumi
Video: Centralizētā eksāmena latviešu valodā rezultāti 2019./2020.m.g. un ieteikumi

Saturs


Avots: Artinspiring / Dreamstime.com

Izņemšana:

Datu zinātniekiem acīmredzami ir vajadzīgas spēcīgas matemātikas un kodēšanas prasmes, taču veiksmei ir būtiska arī komunikācija un citas mīkstas prasmes.

Datu zinātnieks tiek atzīts par labāko 2019. gada darbu Amerikā vietnē Glassdoor. Tas nav pārsteidzoši, jo vidējā pamatalga ir USD 108 000 un apmierinātības pakāpe - 4,3 no 5, kā arī prognozēts ievērojams skaits atvērumu. Jautājums ir šāds: Kas jādara, lai nokļūtu uz ceļa, lai kvalificētos šim darbam?

Lai to uzzinātu, mēs meklējām padomu tiem, kas vēlas nokļūt šajā karjeras trasē. Daudz kas saistīts ar smagajām kodēšanas un matemātikas prasmēm. Bet tikai spēcīgais aprēķins vien to nemazina. Veiksmīgiem datu zinātniekiem arī jāspēj runāt ar biznesa cilvēkiem uz viņu pašu noteikumiem, kas prasa iespējas, kas saistītas ar maigām prasmēm un vadību. (Lai uzzinātu vairāk par datu zinātnieka pienākumiem, skat. Darba lomu: datu zinātnieks.)

Izglītības fonda veidošana: trīs galvenie padomi

Drace Žana, NYC Datu zinātnes akadēmijas datu zinātniece, uzsver nepieciešamību pēc izglītības pamata, kas ietver kodēšanas un matemātikas spēju pamatus:


  1. R / Python + SQL. Ja jums nav kodēšanas iemaņu, jums ir nepieciešams daudz tīkla iespēju un citas jomas, lai palielinātu šo deficītu. Esmu redzējis datu zinātniekus ar vāju matemātiku un nelielu pieredzi domēnos, taču viņus vienmēr ir pārņēmusi spēja kodēt. Python ir ideāls, bet R ir lielisks atgriezeniskās saites rīks. Vislabāk, ja jūs abi esat savā arsenālā. SQL ir ārkārtīgi svarīgs arī datu analītiķim.

  2. Spēcīgas matemātikas prasmes. Ļoti laba izpratne par dažām parasti izmantotajām metodēm: vispārinātiem lineāriem modeļiem, lēmumu koku, K-līdzekļiem un statistiskiem testiem ir labāka nekā plaša dažādu modeļu vai specializāciju, piemēram, RNN, attēls.

Tās ir galvenās prasmes, uz kurām balstīties, lai gan daži eksperti tās papildina. Piemēram, KDnuggets sarakstā ir kodētie komponenti, kurus Zhan pieminēja, un pievienotas dažas citas noderīgas lietas, kas jāzina tehniskajā pusē, ieskaitot Hadoop platformu Apache Spark, datu vizualizācija, nestrukturēti dati, mašīnmācība un AI.


Bet, ja mēs ņemtu vērā norādes no aptaujas par visbiežāk izmantotajiem rīkiem, kas Kaggle aptaujā identificēti izmantošanai reālajā dzīvē, mēs iegūstam nedaudz atšķirīgus rezultātus. Kā redzams no zemāk redzamo 15 labāko variantu diagrammas, Python, R un SQL viegli veido top trīs, bet ceturtais ir Jupyter piezīmjdatori, kam seko TensorFlow, Amazon Web Services, Unix apvalks, Tableau, C / C ++, NoSQL , MATLAB / Octave un Java, visi apsteidzot Hadoop un Spark. Vēl viens papildinājums, kas varētu pārsteigt cilvēkus, ir Microsoft Excel datu ieguve.

Attēla pieklājība no Kaggle

KDnuggets sarakstā ir arī padoms par formālo izglītību. Lielākajai daļai zinātnieku ir paaugstināti grādi: 46 procentiem ir doktora grādi un 88 procentiem ir vismaz maģistra grāds. Viņu iegūtie bakalaura grādi parasti tiek sadalīti starp saistītajām jomām. Apmēram trešdaļa ir matemātikā un statistikā, kas ir vispopulārākais šajā karjeras trasē. Nākamais populārākais ir datorzinātņu grāds, ko iegūst 19 procenti, un inženierzinātnes, kuru izvēle ir 16 procenti. Protams, tehniskie rīki, kas īpaši attiecas uz datu zinātni, bieži netiek pētīti grāda programmās, bet gan specializētās sāknēšanas nometnēs vai tiešsaistes kursos.

Vairāk nekā kursi: vēl divi padomi

Hanks Juņs, Veila Kornela medicīnas Plaušu nodaļas asistents un NYC Datu zinātnes akadēmijas students, iesaka datu zinātniekiem, kuri vēlas iegūt informāciju, plānot, pie kā viņi strādās, un atrast mentoru. Viņš teica:

Bez kļūdām, bez stresa - jūsu soli pa solim, kā izveidot programmatūru, kas maina dzīvi, neiznīcinot savu dzīvi

Jūs nevarat uzlabot savas programmēšanas prasmes, ja nevienam nerūp programmatūras kvalitāte.

Nekļūdieties, ko izdarīju, sakot sev, ka zināt datu zinātni, jo apmeklējāt kursu un saņēmāt sertifikātu. Tas ir lielisks sākums, bet, kad sākat studēt, dodieties prātā, domājot par projektu. Tad atrodiet mentoru laukā un nekavējoties sāciet aizraušanās projektu! Kad esat svaigs, jūs nezināt, ko nezināt, tāpēc tas palīdz, kad kāds ir klāt, lai jūs palīdzētu jums to, kas jums ir svarīgs, un kas ne. Jūs nevēlaties tērēt daudz laika studijām, neko neparādot!

Zināšana, kuru rīku izņemt no jūsu rīklodziņa: Padoms, kā palikt priekšā līknei

Ņemot vērā datu zinātnes rīku ranžēšanas atšķirības, daži var justies apjukumā, kam pievērsties. Celeste Fralick, drošības programmatūras kompānijas McAfee galvenā datu zinātniece, pievēršas šai problēmai CIO rakstā, kurā apskatītas datu zinātnieka pamatprasmes, paziņojot: “Datu zinātniekam jāpaliek līknes priekšā pētniecībā, kā arī izprotiet, kura tehnoloģija ir jāpiemēro, kad. ”Tas nozīmē, ka mūs nepievilina“ seksīgais ”un jaunais, kad faktiskā problēma” prasa kaut ko daudz modernāku. "Apziņa par ekosistēmas aprēķināšanas izmaksām, skaidrojamību, latentumu, joslas platumu un citiem sistēmas robežnosacījumiem, kā arī klienta gatavība pati par sevi palīdz datu zinātniekam saprast, kādu tehnoloģiju izmantot."

Būtiskas maigās prasmes: vēl seši padomi

Punkts, ko Fraliks izceļ, attiecas uz netehniskajām prasmēm, kuras prasa datu zinātnieka darbs. Tieši tāpēc KDnuggets sarakstā ir šie četri: intelektuālā zinātkāre, komandas darbs, komunikācijas prasmes un lietišķā uzņēmējdarbība. Zhan arī savos padomos datu zinātniekiem iekļāva galvenās mīkstākās prasmes, identificējot tādas “komunikācijas prasmes” kā KDnuggets, bet “biznesa lietpratības” vietā izmanto “domēna zināšanas”. Lai kā to sauc, tas attiecas uz datu zinātnes praktisku pielietojumu Bizness. (Lai uzzinātu vairāk par komunikācijas prasmēm, skatiet sadaļu Komunikācijas prasmju nozīme tehniskajiem speciālistiem.)

Olīvija Parra-Ruda piedāvāja savu izvēli par to, pievienojot vēl divas mīkstas prasmes, liekot uzsvaru uz radošuma lomu, apgalvojot: “Es domāju par datu zinātni kā par mākslu, nevis par zinātni”, kaut ko tādu, kas jāizmanto smadzeņu abu pušu stiprās puses. “Daudzi cilvēki runā par datu zinātni kā karjeru, kurā galvenokārt tiek izmantotas kreisās smadzenes. Es atklāju, ka datu zinātniekiem, lai gūtu panākumus, ir jāizmanto visas smadzenes. ”

Viņa paskaidroja, ka virzībai uz priekšu ir nepieciešama ne tikai tehniskā kompetence, bet arī radošums un vadībai nepieciešamā vīzija:

Lielākā daļa kreiso smadzeņu / lineāro uzdevumu var būt automatizēti vai piesaistīti. Lai piedāvātu konkurences priekšrocības kā datu zinātniekiem, mums jāspēj atpazīt modeļus un sintezēt lielu daudzumu informācijas, izmantojot abas mūsu smadzeņu puses. Un mums jābūt novatoriskiem domātājiem. Daudzi no labākajiem rezultātiem rodas kreisās un labās smadzeņu integrācijas rezultātā.

Viņa arī uzsvēra, kāpēc vīzijas izteikšana ir nepārprotami būtiska:

Kā datu zinātnieki, mūsu mērķis ir izmantot datus, lai palīdzētu mūsu klientiem palielināt savu peļņu. Lielākā daļa vadītāju nesaprot, ko mēs darām vai kā mēs to darām. Tāpēc mums jādomā līdzīgi vadītājiem un jāpaziņo par mūsu atklājumiem un ieteikumiem valodā, kuru saprot mūsu ieinteresētās puses un kurai uzticas.

Datu ducis

Galvenie padomi ietver lielāku skaitu tehnisko instrumentu, prasmes un iespējas, kā arī mazāk kvantificējamas īpašības, piemēram, spēju radošumam un vadībai. Galu galā tā nav tikai skaitļu spēle. Tā kā datu zinātne nav tikai modeļu radīšana vakuumā, bet nāk klajā ar praktiskiem pielietojumiem, lai risinātu reālās dzīves problēmas uzņēmumiem, tiem, kas gūs panākumus šajā jomā, ir ne tikai jāapgūst tehnoloģija, bet arī jāzina viņu biznesa joma un jāsaprot dažādi komandas locekļi darbā.