Podatkovni znanstveniki: Nove rock zvezde tehniškega sveta

Avtor: Robert Simon
Datum Ustvarjanja: 24 Junij 2021
Datum Posodobitve: 1 Julij. 2024
Anonim
High Density 2022
Video.: High Density 2022

Vsebina


Vir: Onradio / iStockphoto

Odvzem:

Vloga podatkovnega znanstvenika hitro postaja najbolj iskana kariera tehnološkega sveta. O tem, kako je dobil službo, in njegovih nasvetih za uspeh na tem področju smo povprašali najvišjega znanstvenika o podatkih Jaka Porwayja iz New York Timesa.

Vloga podatkovnega znanstvenika hitro postaja najbolj iskana kariera v tehnološkem svetu. Podjetja, kot so Google, Amazon in LinkedIn, uporabljajo podatkovne znanstvenike, da jim pomagajo ohraniti to inovativno prednost v dobi digitalnih podatkov. In zdaj ljubitelji podatkov in tehnologij si prizadevajo, da bi postali znanstveniki podatkov enako, kot si nekateri glasbeniki prizadevajo postati rock zvezde. Morda zato nekateri ljudje znanstvenike podatkov navajajo kot nove rock zvezde tehnološke dobe.

Na žalost je ta vloga še vedno tako nova, da je v njih še vedno precej nejasnosti, kar pomeni, da mnogi znanstveniki, ki želijo podatke, vozijo svoje avtobuse po napačni cesti. Ali si znanstveniki podatkov zaslužijo sloves rock zvezde? Potopimo se v svet podatkovne znanosti z intervjujem z Jakeom Porwayem, podatkovistom iz raziskovalnega in razvojnega laboratorija v The New York Timesu.


Data Scientist: Techs Rock Stars?

Zakaj torej znanstvenike, na katere se podatki nanašajo, imenujejo nove rock zvezde tehnološkega sveta? Ta analogija pravzaprav sega globlje od podatkov, ki jih želijo slišati ultrahladnosti. Tako kot rock zvezda tudi poklicna kariera znanstvenikov vključuje raznolikost, umetniško svobodo in prilagodljivost. Tako kot rock zvezde sveta zabave, tudi najboljši znanstveniki s podatki pridobivajo veliko ljudi iz vseh področij podatkovne in tehnološke industrije.

Kar počne podatkovni znanstvenik, je zelo raznoliko; tako kot glasbeniki uporabljajo različne inštrumente, orodja in tehnike za igranje glasbenih stilov, ki so enako različni kot jazz in death metal, tudi podatkovni znanstvenik obvlada določeno orodje in področje. Vključen je tudi njihov slog. In tudi ni pravega ali napačnega načina opravljanja dela - gre za vpliv, ki ga delo ima na druge ljudi.

Ko so Beatli pisali svoje pesmi, ni samo ena oseba narekovala, kako je treba igrati vsako noto na vsakem instrumentu. Zbrali so se in se zataknili; skozi ustvarjalno odkrivanje so našli pesmi, ki so delovale. Enako za znanstvenike s podatki. Začutiti morajo ritem, stopiti v žleb in uskladiti rešitev. To je možno le s pravo mero umetniške svobode, da preizkusimo kakršne koli pristope, orodja in tehnike, ki bi nam lahko prišli na misel v trenutku - in spretnost, da spremenimo spremembe, ko se zdi, da nekaj ni ključnega pomena.


Ko znanstvenik, ki se ukvarja s podatki, obvlada temeljne temelje, postane prilagodljiv in si pridobi zaupanje v rešitve na drugih področjih. O teh temeljnih osnovah bomo več govorili kasneje. Tu je treba poudariti, da ko enkrat obvladate znanost o podatkih, lahko prevzamete vlogo na poljubnem področju, saj so podatki povsod.

Končni cilj znanstvenika s podatki je ustvariti ogromne vrednosti za čim večje število ljudi. Medtem ko podatkovni znanstvenik deluje zakulisno, ni nič drugače kot igrati širokemu občinstvu: boljše kot opravljate delo, več ljudi boste dosegli - in več nagrad boste videli.

Znanstveniki, kaj počnejo?

Kaj točno počnejo znanstveniki s podatki? Poglejmo to s primerom, na katerega bi se lahko vsi navezali.

Brez napak, brez stresa - vaš korak za korakom vodnik za ustvarjanje programske opreme, ki spreminja življenje, ne da bi vam uničila življenje

Ne morete izboljšati svojih programskih veščin, kadar nikogar ne skrbi za kakovost programske opreme.

Recimo, da nekega dne spoznate, da nimate enake količine energije kot dan prej. Tako ste si postavili cilj: čez dan imeti več energije. To je precej širok in dvoumen cilj. Torej, prvi korak kot znanstvenik podatkov je odstraniti nekaj te dvoumnosti in količinsko ovrednotiti merljivost. Za to obstajajo metode. Tu se ne bomo spuščali v podrobnosti, ampak naj povemo le, da si teoretiziramo, da ne zaspimo in si zato damo pod cilj, da si vsako noč zagotovimo osem ur spanja.

Čeprav je ta cilj nekoliko bolj merljiv in manj dvoumen, ima svoje izzive. Časovnika res ne morete zagnati, ko zaspite, in četudi ga vklopite po skoku v posteljo, morda ne zaspite takoj. Poleg tega je težko izračunati čas, ko se zbudite sredi noči. Končno obstajajo različne vrste spanja, na primer globok spanec in lahkoten spanec. Bistvo je, da je težko natančno izmeriti spanec in zato še težje izmeriti njegov vpliv na vaše energijske ravni.

Kaj lahko torej storite? No, kot podatkovni znanstvenik iščete najnovejše tehnologije in odkrijete, da obstajajo naprave za spremljanje spanja.In če ste takšno napravo uporabili za merjenje in digitalno snemanje spanja, bi lahko dobili natančnejše podatke o svojem spanju in te podatke čez čas zbirali za risanje grafa.

Samo to vam lahko daje boljši vpogled v dogajanje. Vizualna predstavitev vam bo dala zavest, jasnost in usmeritev. Lahko boste videli, ali dosežete svoj cilj osem ur spanja na noč in, kar je še pomembneje, boste lahko ukrepali, če niste.

To je osnovna naloga podatkovnega znanstvenika: prinašati nove načine merjenja in prikazovanja podatkov, tako da bodo tisti, ki ga gledajo, zagotovili večjo ozaveščenost, jasnost in smer.

Toda dober podatkovist se ne ustavi pri tem. Ko so podatki zbrani, jih je mogoče integrirati z vsemi drugimi merjenimi dejavnostmi, ki jih izvajate čez dan. Vključite ga v svojo produktivnost na podlagi podatkov sistema za upravljanje nalog. Vključite jo v svoje razpoloženje na podlagi tvitov in posodobitev stanja. Vključite ga v svoje zdravje na podlagi obiskov telovadnice ali hujšanja. Možnosti so neskončne, saj je že na voljo količina podatkov in enostavnost zajema.

Kako biti znanstvenik s podatki

Vas zanima kariera v podatkovni znanosti? Ker je podatkovna znanost tako nova, smo za vpogled v področje prosili vrhunskega podatkovnega znanstvenika. Jake Porway je podatkovni znanstvenik pri New York Timesu in ustanovitelj podjetja DataKind (prvotno znan kot Podatki brez meja), ki se neprofitne organizacije, ki potrebujejo podatkovno znanost, ujema s samostojnimi in probonološkimi znanstveniki. Porway ima znanje računalništva in doktorat. v statistiki UCLA. Tukaj je povedal, kako se vključiti v podatkovno znanost, kako dobro in kako se izogniti ključnim napakam na tem področju.

1. Pridobite prave spretnosti

Po Porwayevih besedah ​​je vstop na polje omejen na tri ključne stvari:

  • Praktične računalniške veščine
  • Statistične spretnosti
  • Želja po učenju

"Morate biti sposobni pisati skripte za strganje podatkov in kodirati algoritme, ki se vam pojavijo v glavi," pravi Porway. "Morali bi vedeti svoje osnovne statistike (in še več, v idealnem primeru), če boste resnično lahko presodili, ali modeli, ki jih gradite, ali algoritmi, ki jih pišete, počnejo, kar želite."

2. Vzpostavite povezave

Preden se je Porway zaposlil v laboratoriju za raziskave in razvoj New York Timesa, se je ukvarjal s strojnim učenjem in računalniškim vidom ter porabil veliko časa za robote za prepoznavanje min in letenja letal (kako kul je da?). Šele ko je zaposlil službo v The New York Timesu, se je razširil na širše naloge na področju znanosti o podatkih, in sicer Project Cascade, ki sledi povezavam iz objave po družbenih medijih.

Najpomembnejša stvar na tem področju je, pravi Porway, učenje.

"Pojdi na projekt znanosti o podatkih!" Porway pravi. "Prenesite nekaj podatkov, poberite nekaj R-ja in začnite igrati ... Pravim, da se osredotočim na uporabo nečesa, kot je R, poleg osnovne knjige s statistikami, ki vas bo vodila skozi raziskovanje nekaterih podatkov. Strojno učenje in računalništvo bosta prišli skupaj s tem (od seveda je to odvisno od vaših preteklih izkušenj - če ste že statistik, poberite nekaj Pythona!) "

Potem je čas, da vzpostavite nekaj povezav. Porway priporoča lokalno skupino za srečanja, saj je biti del skupnosti podatkovne znanosti "najhitrejši način, da veš, česa ne veš." In na področju, ki se stalno razvija, je to pomembno.

3. Vstopite v igro

Porway ima doktorat. v statistiki UCLA, vendar poudarja, da tega ne potrebujete za dobro delo.

"To bi lahko pomagalo, vendar ne mislite, da se morate odpraviti in narediti še pet let šole, da se boste lahko imenovali znanstvenik," je povedal Porway.

Podatkovna znanost je razmeroma novo področje. To pomeni, da morajo tisti, ki želijo priti na teren, k njemu pristopiti odprtega duha.

"Znanstvenik s podatki v Foursquareu bo videti precej drugače kot podatkovni znanstvenik pri Goldman Sachsu," pravi Porway.

4. Rock svojo novo vlogo

Znanost podatkov temelji na razjasnitvi ciljev, preučevanju predpostavk, ocenjevanju dokazov in oceni zaključkov. Toda tu je majhen delček sestavljanke, ki ga mnogi spregledajo. Lahko uganite, kaj je to? Kot poroča Porway, je skrivna sestavina kritičnega mišljenja.

"Zame res ločuje hekerje od pravih znanstvenikov," pravi Porway. "Bili bi presenečeni nad tem, kolikokrat sem videl, da je nekdo zgradil model in poročal o rezultatih, ne da bi se zavedal, da ni kritično razmišljal o tem, od kod prihajajo podatki ali če je bil njihov eksperiment pravilno oblikovan. MORATI morate biti sposoben vsakega koraka vašega postopka in vsake številke, ki jo dobite. "

Pot do velikih podatkov

Porway pravi, da ko je spoznal sposobnost uporabe ogromnih količin podatkov, s katerimi so se stroji sami učili, mu je to razburilo um. Njegova strast - in njegova izobrazba in spretnosti - sta mu pomagali doseči vrhunsko delovno mesto v znanosti o podatkih. Če želite prelepiti velike podatke, se z nekaj knjigami prenesite, prenesite nekaj podatkov in začnite se igrati. Nikoli ne veš, kakšen bo kup surovih podatkov.

Za celoten prepis intervjuja pojdite na DataScientists.Net.