Vloga delovnega mesta: Data Scientist

Avtor: Roger Morrison
Datum Ustvarjanja: 28 September 2021
Datum Posodobitve: 11 Maj 2024
Anonim
High Density 2022
Video.: High Density 2022

Vsebina


Vir: Sergey Khakimullin / iStockphoto

Odvzem:

Podatkovni strokovnjaki imajo obsežna delovna mesta, ki se glede na aplikacijo precej razlikujejo. Ampak ena skupna stvar je prizadevanje za dobro uporabo podatkov.

Kaj počne znanstvenik, ki deluje v zvezi z umetno inteligenco in strojnim učenjem? Številni strokovnjaki, ki se vsak dan ukvarjajo s tovrstnimi projekti, bi rekli, da je na vprašanje težko odgovoriti preprosto. Boljše vprašanje bi bilo: Kaj podatkov znanstveniki NE počnejo?

Znanstvenik podatkov je sestavni del procesa AI ali ML v smislu, da so vsi ti projekti odvisni od velikih podatkov ali zapletenih vložkov. Znanstvenik podatkov je bistveni karierist, ki ve, kako delati s podatki za doseganje rezultatov.

Vendar pa obstaja nekaj načinov za pogovor o tem, kaj podatkovni znanstvenik počne, kakšne kvalifikacije potrebuje in kakšna je njegova vloga v procesu.

Preberi: 6 ključnih konceptov znanosti o podatkih, ki jih lahko obvladate s pomočjo spletnega učenja


Različne opredelitve, raznolike dajatve

Številni strokovnjaki, ki opisujejo delo podatkovnega znanstvenika, o njem govorijo v širokem smislu.

"V majhnih podjetjih ali pri delu na novem trgu je vloga podatkovnega znanstvenika pretvoriti razmeroma nove (vendar očitne) vire podatkov v stvari, ki rešujejo težavo za končnega uporabnika, kar prej ne bi bilo mogoče, kjer uporabljene tehnologije niso obstajale, "pravi Antonio Hicks, vodja računa pri Mercury Global Partners. "Idealen kandidat je nekdo, ki je del matematika, del programskega inženirja in del podjetnik."

Drugi odmevajo to osnovno idejo in omenjajo, kaj morajo znanstveniki, da bi se lotili modeliranja.

"Najpomembnejši atribut, ki ga podatkovni znanstvenik potrebuje, je globoka radovednost o svetu okrog njih - ne glede na to, ali odgovarjajo na vprašanja ali gradijo modele, ključna je želja po razumevanju težave pred njimi," pravi Erin Akinci, vodja podatkov znanstvenika pri Asani. "Od tam bo večina ljudi potrebovala znanje matematike in programiranja, da bi našla rešitve, vendar se posebne vrste matematike in programiranja močno razlikujejo glede na področje strokovnega znanja v podatkovni znanosti."


Brez napak, brez stresa - vaš korak za korakom vodnik za ustvarjanje programske opreme, ki spreminja življenje, ne da bi vam uničila življenje

Ne morete izboljšati svojih programskih veščin, kadar nikogar ne skrbi za kakovost programske opreme.

"Odlično znanstveno delo ima več opravka z načinom, kako znanstvenik razmišlja o neki težavi, kot z orodji, ki jih uporabljajo za rešitev," doda Charlie Burgoyne, ustanovitelj in izvršni direktor Valkyrie Intelligence. Valkyrie je podjetje za uporabno svetovanje z impresivnimi projekti pod svojim krilom, kot je Mark I, namenski omrežni aparat, ki spodbuja usposabljanje in testiranje nevronskih omrežij, izboljšuje, kar je mogoče s predhodnimi platformami strojnega učenja na osnovi oblaka.

"Trg zahteva znanstvenike, ki so usposobljeni za razvoj Python-a, oblikovanje nevronskih omrežij in sposobnost preoblikovanja shrambe podatkov v najnovejšo arhitekturo baz podatkov," pravi Burgoyne. "Vendar so te zmožnosti nadarjenega znanstvenika. Manj očitno je znanstvenikova sposobnost za neustrašno radovednost, agresivno iznajdljivost in privrženost znanstveni metodi. "

Spretnosti podatkovnega znanstvenika

Kar zadeva praktične spretnosti, znanstveniki s podatki potrebujejo nekaj kreativnosti in spretnosti, kolikor gre za modeliranje. Prav tako lahko veliko koristijo, če imajo "trde spretnosti", na primer kodiranje izkušenj v Python-u, C ++ ali drugih običajnih jezikih, ki se uporabljajo za ML-projekte.

"Python in C ++ sta bistvenega pomena in sta sposobna kombinirati veščine kodiranja z analizo in obdelavo podatkov ter statistiko, so temeljne spretnosti, zaradi katerih se bo znanstvenik, ki se ukvarja s podatki, izkazal kot močan kandidat ali uslužbenec," pravi Val Streif iz Pramp-a, spletna platforma za intervjuje za programske inženirje, razvijalce in podatkovne strokovnjake. "Medtem ko bi bilo za nekatere programske spretnosti mogoče poskrbeti s povezovanjem podatkovnih strokovnjakov z razvijalcem, je veliko boljše, če sta obe sposobnosti združeni v enem, z vidika podjetja."

Drugi strokovnjaki na seznam dodajo R, Hadoop, Spark, Sas in Java ter tehnologije, kot so Tableau, Hive in MATLAB.

Vsi se navdušujejo za življenje, vendar nekateri tisti, ki imajo izkušnje z zaposlovanjem znanstvenikov, pravijo, da so tudi druge "človeške" strani zadeve. (Ena vrsta podatkov je znanstvenik, ki je državljan s podatki o državljanih. Več o tem v Vlogi državljanov s področja podatkov v svetu velikih podatkov.)

"Tradicionalno posamezniki z različno svobodno umetniško izobrazbo delajo odlične podatkovne znanstvenike," pravi Burgoyne, ki razlikuje med inženirji, ki so na stavbi, in podatkovnim znanstvenikom, katerih delo je lahko veliko bolj konceptualno. Nadaljuje:

Strokovno znanje na tradicionalnem področju STEM s komplementarnim poudarkom na humanističnih, umetnostnih ali poslovnih področjih prinaša tiste lastnosti, zaradi katerih je odličen znanstveno usmerjen znanstvenik. Povedati je treba, da je prav tako pomembna sposobnost organizacije, da izkoristi te lastnosti in na svoj način produktivno oblikuje svoj vnemo in metode. Opazil sem, da je organizacija, ko je pobuda za znanost podatkov neuspešna, verjetno tako krivda kot znanstveniki. Znanstveniki niso inženirji. Niso poganjani za izvajanje in gradnjo. Privedeni so k odkrivanju in razumevanju. Organizacije, ki razumejo to razliko, so za obdelovanje obeh polj dobro nagrajene.

Kar se podatkov, na katere se znanstveniki navadno nanašajo, nanašajo na temeljne cilje podjetja. Nekatera podjetja lovijo decentraliziran internet - nekatera se igrajo z IoT ali SaaS. Drugi se trudijo, da bi postali „uporabniku prijazen“ ali „etičen“ ali „pregleden“ AI.

Vsekakor bodo znanstveniki s podatki verjetno premagali razkorak med trdnimi metričnimi podatki na podatkih, ki jih uporabljajo, ne glede na to, kakšen tehnološki sklop je v uporabi, in svobodnim delom zasnove funkcionalnosti AI / ML.

"Najemnike podatkov najamemo za upravljanje zbiranja in čiščenja podatkov ter za njihovo prevajanje v pomembne informacije," pravi Michael Hupp, vodja podatkovne znanosti in analitike v G2 Crowd. Izdela:

Običajno to pomeni upravljanje vseh pomembnih algoritmov, ki poganjajo podatkovni mehanizem podjetja in dobro poznajo ključna analitična orodja in jezike, v zadnjih letih pa vključujejo tudi nova področja, kot so obdelava naravnega jezika, strojno učenje in druge oblike analize, ki omogoča AI. Najuspešnejši podatkovni znanstveniki so tisti, ki združijo svoje trde spretnosti z zmožnostjo hitrega učenja in zmožnosti učinkovitega posredovanja vpogledov, ki jih odkrijejo, tako da so pomembni za njihovo poslovanje.

S tovrstnimi vpogledi lahko mladi strokovnjaki ali študenti lažje ugotovijo, ali bi jim bil znanstvenik podatkov dobra vloga in kako pridobiti znanje. Učenje STEM postaja bolj dostopno v šolah po državi, vendar ga strast do kodiranja in tehnologije ter zmožnost učenja letenja ne more nadomestiti.