12 ključnih nasvetov za učenje znanosti o podatkih

Avtor: Laura McKinney
Datum Ustvarjanja: 3 April 2021
Datum Posodobitve: 1 Julij. 2024
Anonim
Predstavitev ključnih področij območnih gozdnogospodarskih in lovsko upravljavskih načrtov
Video.: Predstavitev ključnih področij območnih gozdnogospodarskih in lovsko upravljavskih načrtov

Vsebina


Vir: Artinspiring / Dreamstime.com

Odvzem:

Podatki znanstveniki očitno potrebujejo močne matematične in kodirne spretnosti, vendar so za uspeh bistvenega pomena tudi komunikacija in druge mehke veščine.

Podatkovni znanstvenik se je kot najboljše delovno mesto za leto 2019 v Ameriki uvrstil na Glassdoor. S srednjo osnovno plačo v višini 108.000 dolarjev in oceno zadovoljstva z delovnim mestom 4,3 od 5, skupaj s predvidenim poštenim številom odprtin, to ni presenetljivo. Vprašanje je: Kaj moraš narediti, da se lahko uvrstiš v to službo?

Da bi to ugotovili, smo poiskali nasvete, ki jih dajejo tistim, ki si želijo iti na to poklicno pot. Veliko se spušča na trde veščine kodiranja in matematike. Toda samo močno računanje tega ne zmanjša. Uspešni podatkovni znanstveniki morajo biti sposobni tudi sami govoriti s poslovnimi ljudmi, kar zahteva zmogljivosti, povezane z mehkimi veščinami in vodstvom. (Če želite izvedeti več o nalogah podatkovnega znanstvenika, glejte Job Role: Data Scientist.)


Gradnja izobraževalne fundacije: trije osnovni nasveti

Drace Zhan, podatkovna znanstvenica z NYC Data Science Academy, poudarja potrebo po izobraževalni fundaciji, ki vključuje osnove kodiranja in matematičnih sposobnosti:

  1. R / Python + SQL. Če nimate veščin kodiranja, potrebujete veliko moči za povezovanje v mrežo in druga področja, da bi zmanjšali ta primanjkljaj. Videl sem znanstvenike s šibko matematiko in malo domenskih izkušenj, vendar jih vedno širi sposobnost šifriranja. Python je idealen, vendar je R odlično orodje za nazaj. Najbolje je, da imate oboje v svojem arzenalu. SQL je izredno pomemben tudi za podatkovni analitik.

  2. Močne matematične spretnosti. Zelo dobro razumevanje nekaterih najpogosteje uporabljenih metod: posplošenih linearnih modelov, odločitvenega drevesa, K-sredstev in statističnih testov je bolje kot imeti široko sliko različnih modelov ali specializacije, kot je RNN.

To je osrednja veščina, ki jo je treba graditi naprej, čeprav jim nekateri strokovnjaki dodajajo. Na primer, seznam KDnuggets vključuje komponente kodiranja, ki jih je omenjal Zhan, in dodaja še nekaj koristnih stvari, ki jih morate vedeti s tehnične strani, vključno s platformo Hadoop Apache Spark, vizualizacijo podatkov, nestrukturiranimi podatki, strojnim učenjem in AI.


Če pa vzamemo nalogo iz ankete o najpogosteje uporabljenih orodjih, ki jih je za uporabo v resničnem življenju ugotovila raziskava Kaggle, dobimo nekoliko drugačne rezultate. Kot je razvidno iz grafa zgornjih 15 izbir, lahko Python, R in SQL zlahka uvrstijo prve tri, četrti pa so Jupyterjevi prenosniki, sledijo jim TensorFlow, Amazon Web Services, lupina Unix, Tableau, C / C ++, NoSQL , MATLAB / Octave in Java, vse pred Hadoop in Spark. Še en dodatek, ki lahko preseneti ljudi, je Microsoftov Excelov podatkovni rudarjenje.

Zabava slik Kaggle

Seznam KDnuggets vsebuje tudi nasvet v zvezi s formalnim izobraževanjem. Večina znanstvenikov s podatki ima višjo stopnjo izobrazbe: 46 odstotkov jih ima doktorate in 88 odstotkov najmanj magisterij. Podiplomske stopnje, ki jih imajo, so na splošno razdeljene med sorodna področja. Približno tretjina je matematike in statistike, ki je najbolj priljubljena za to kariero. Naslednja najbolj priljubljena sta študij računalništva, ki ima 19 odstotkov, in inženiring, izbira 16 odstotkov. Seveda tehničnih orodij, ki se nanašajo na podatkovno znanost, pogosto ne preučujejo v diplomskih programih, ampak na specializiranih zagonskih kampih ali prek spletnih tečajev.

Več kot Tečaji: Še dva nasveta

Hank Yun, znanstveni sodelavec na pulmološkem oddelku na Weill Cornell Medicine in študent na akademiji NYC Data Science Academy, ki se ukvarja s podatki, svetuje, da načrtujejo, kaj bodo delali in poiskali mentorja. Rekel je:

Brez napak, brez stresa - vaš korak za korakom vodnik za ustvarjanje programske opreme, ki spreminja življenje, ne da bi vam uničila življenje

Ne morete izboljšati svojih programskih sposobnosti, če nikogar ne skrbi za kakovost programske opreme.

Ne delajte napake, ko sem si rekel, da poznate znanost o podatkih, ker ste obiskovali tečaj in prejeli potrdilo. To je odličen začetek, ko pa začneš študirati, pojdi s projektom v mislih. Potem poiščite mentorja na tem področju in takoj začnite strastni projekt! Ko ste sveži, ne veste, česa ne veste, zato pomaga, ko je nekdo tam, da vas napoti, kaj je pomembno za vas in kaj ne. Nočete porabiti veliko časa za študij in ničesar za to pokazati!

Vedeti, katero orodje je treba izvleči iz svojega Orodja: Nasvet, kako ostati pred krivuljo

Glede na razlike v razvrstitvi orodij za podatkovne znanosti se lahko nekateri čutijo zmedeni, na kaj se morajo osredotočiti. Celeste Fralick, glavna podatkovna znanstvenica v podjetju za varnostno programsko opremo McAfee, je v CIO članku obravnavala to težavo, ki preučuje bistvene veščine podatkovnega znanstvenika in izjavljala: „Znanstvenik s podatki mora ostati pred krivuljo v raziskavah, pa tudi razumeti, katero tehnologijo uporabiti. "To pomeni, da vas" seksi "in novi, ko je dejanska težava, ne vabijo veliko večjega števila obratov. "Ker se zaveda, da so za ekosisteme računski stroški, interpretabilnost, zamuda, pasovna širina in drugi sistemski mejni pogoji - kot tudi zrelost stranke, samo po sebi pomaga znanstveniku, da razume, katero tehnologijo mora uporabiti."

Bistvene mehke spretnosti: Še šest nasvetov

Točka, ki jo je predstavil Fralick, se nanaša na netehnične veščine, ki jih zahteva delovno mesto znanstvenika. Zato seznam KDnuggets vključuje te štiri: intelektualna radovednost, timsko delo, komunikacijske veščine in poslovna ošabnost. Zhan je v svoje nasvete za podatkovne strokovnjake vključil tudi ključne mehke veščine, s katerimi je opredelil "komunikacijske veščine", kot so KDnuggets, vendar je uporabil "domensko znanje" namesto "poslovne ošabnosti". Kakor koli se imenuje, se nanaša na praktično uporabo znanosti o podatkih v posel. (Če želite izvedeti več o komunikacijskih veščinah, glejte Pomen komunikacijskih veščin za tehnične strokovnjake.)

Olivia Parr-Rud se je tega lotila in dodala še dve mehki veščini, s poudarkom na vlogi ustvarjalnosti, trdijo, da "podatkovna znanost mislim kot umetnost toliko kot znanost", kar zahteva, da se opiraš na jakosti obeh strani možganov. "Mnogi govorijo o podatkovni znanosti kot karieri, ki primarno uporablja leve možgane. Ugotovil sem, da morajo znanstveniki s podatki, da bi bili uspešni, uporabljati celotne možgane. "

Pojasnila je, da za napredovanje na tem področju ni potrebna le tehnična usposobljenost, temveč kreativnost in vizija, potrebna za vodstvo:

Večina levo-možganskih / linearnih opravil je mogoče avtomatizirati ali jih pridobiti. Kot znanstvenikom s podatki lahko ponudimo konkurenčno prednost, moramo biti sposobni prepoznati vzorce in sintetizirati velike količine informacij z uporabo obeh strani naših možganov. In moramo biti inovativni misleci. Številni najboljši rezultati so posledica integracije levih in desnih možganov.

Poudarila je tudi, zakaj je jasno sporočanje vizije nujno:

Kot podatkovni znanstveniki je naš cilj uporabiti podatke za pomoč strankam pri povečanju dobička. Večina direktorjev ne razume, kaj počnemo ali kako to počnemo. Zato moramo razmišljati kot voditelji in svoje ugotovitve in priporočila sporočiti v jeziku, ki ga naše interesne skupine razumejo in jim zaupajo.

Dolžina podatkov

Ključni nasveti vključujejo večje število tehničnih orodij, spretnosti in sposobnosti ter manj merljivih lastnosti, kot sta sposobnost ustvarjalnosti in vodenja. Na koncu ne gre samo za igro s številkami. Ker podatkovna znanost ne gre samo za ustvarjanje modelov v vakuumu, temveč za pripravo praktičnih aplikacij za reševanje resničnih življenjskih težav za podjetja, tisti, ki bodo uspeli na tem področju, ne smejo samo obvladati tehnologije, temveč poznati svojo poslovno domeno in razumeti potrebe različni člani ekipe pri delu.