Podatkovna znanost ali strojno učenje? Tukaj je, kako opaziti razliko

Video.: Data Science vs Machine Learning – What’s The Difference | Data Science Tutorial | Simplilearn

Vsebina

Znanost o podatkih in strojno učenje: široka in ozka terminologija
Nabori znanj o podatkih in strojnem učenju
Brez napak, brez stresa - vaš korak za korakom vodnik za ustvarjanje programske opreme, ki spreminja življenje, ne da bi vam uničila življenje
Kako opaziti strojno učenje
Dve disciplini vrhunskih robov

Vir: Elnur / Dreamstime.com

Odvzem:

Znanost o podatkih in strojno učenje sta v ključnih pogledih različna. Na nek način lahko eno vidimo kot podmnožico druge. Obe sta pomembni pri trenutnem napredku IT.

V tem novem svetu umetne inteligence in upravljanja podatkov je enostavno zmedeti nekatere izraze, ki se najpogosteje uporabljajo v svetu IT.

Na primer, podatkovna znanost in strojno učenje imata veliko skupnega. Ni presenetljivo, da bi mnogi ljudje s samo poznavanjem teh disciplin težko ugotovili, kako se med seboj razlikujejo.

Tu je najboljši način za ločevanje znanosti o podatkih od strojnega učenja, kot načelo in kot tehnološki pristop.

Znanost o podatkih in strojno učenje: široka in ozka terminologija

Najprej je podatkovna znanost res široka, splošna kategorija tehnologije, ki zajema veliko različnih vrst projektov in kreacij. (Za več informacij o tem, kaj sodeluje v nalogi s področja znanosti o podatkih, glej Job Role: Data Scientist.)

Znanost o podatkih je v bistvu praksa dela z velikimi podatki. Pojavilo se je, da je Mooreov zakon in širjenje učinkovitejših naprav za shranjevanje privedlo do ogromnih količin podatkov, ki jih zbirajo podjetja in druge stranke. Nato so velike podatkovne platforme in orodja, kot je Hadoop, začeli na novo definirati računalništvo s spreminjanjem načina upravljanja podatkov. Zdaj so oblaki in kontejnerji ter popolnoma novi modeli veliki podatki postali glavno gonilo načinov, kako delamo in živimo.

V najpreprostejši obliki je znanost o podatkih način upravljanja teh podatkov, od čiščenja in rafiniranja do uporabe v obliki vpogleda.

Opredelitev strojnega učenja je veliko ožja. Pri strojnem učenju tehnologije prevzamejo podatke in jih posredujejo z algoritmi, da bi simulirali človekove kognitivne procese, opisane kot "učenje." Z drugimi besedami, računalnik je sposoben zagotoviti lastne rezultate. , kjer se zdi, da se je tehnologija naučila iz procesov, ki jih izvajajo programerji.

Nabori znanj o podatkih in strojnem učenju

Drug način za primerjanje podatkovnih podatkov in strojnega učenja je pogled na različne spretnosti, ki so za strokovnjake na katerem koli od teh področij najbolj dragocene.

Brez napak, brez stresa - vaš korak za korakom vodnik za ustvarjanje programske opreme, ki spreminja življenje, ne da bi vam uničila življenje

Ne morete izboljšati svojih programskih veščin, kadar nikogar ne skrbi za kakovost programske opreme.

Obstaja splošno soglasje, da znanstveniki s podatki uživajo globoke analitične in matematične veščine, praktične izkušnje s tehnologijami baz podatkov in znanje programskih jezikov, kot je Python ali drugi paketi, ki se uporabljajo za razčlenjevanje velikih podatkov.

"Kdor je zainteresiran za gradnjo močne kariere na področju (podatkovne znanosti), naj pridobi ključne spretnosti na treh oddelkih: analitiki, programiranju in poznavanju domen," piše Srihari Sasikumar iz Simplilearna. »Če se boste globlje stopnjevali za eno stopnjo, vam bodo naslednje podatkovne veščine pomagale izdelovati nišo: podatkovno znanje: Python, SAS, R (in) Scala, praktične izkušnje s kodiranjem baz podatkov SQL, sposobnost dela z nestrukturiranimi podatki različni viri, kot so video in družbeni mediji, razumejo številne analitične funkcije (in) znanje strojnega učenja. "

Na strani strojnega učenja strokovnjaki pogosto navajajo veščine modeliranja podatkov, verjetnost in znanje statistike ter širše programsko znanje kot koristno orodje v orodni opremi strojnega učenja inženirja.

Kako opaziti strojno učenje

Ključno pri tem je, da vse vrste stvari obsegajo delo s področja znanosti o podatkih, vendar to ni strojno učenje, razen če imate vzpostavljen zelo strog režim, da se računalnik lahko nauči iz njegovih vložkov.

Ko je to vzpostavljeno, omogoča nekaj presenetljivo sposobnih sistemov, ki imajo lahko zelo velik vpliv na naše življenje.

"Veliko tega, kar počnemo s strojnim učenjem, se zgodi pod površjem," je po poročanju ustanovitelj Amazona Jeff Bezos opozoril na nekatere aplikacije teh sistemov. »Strojno učenje poganja naše algoritme za napovedovanje povpraševanja, razvrstitev iskanja izdelkov, priporočila za izdelke in ponudbe, umestitve trgovcev, odkrivanje prevar, prevode in še veliko več. Čeprav je manj viden, bo velik vpliv strojnega učenja tovrsten - tiho, a smiselno izboljšuje osnovne operacije. "

Eden najbolj koristnih primerov je nastanek nevronske mreže - to je pogosta in priljubljena metoda nastavitve procesov strojnega učenja.

V svoji najbolj osnovni obliki je nevronska mreža sestavljena iz plasti umetnih nevronov. Vsak posamezni umetni nevron ima funkcijo, ki je enakovredna biološkemu nevronu, vendar ima namesto sinaps in dendritov vhod, funkcijo aktiviranja in morebitne izhode.

Nevronska mreža je zasnovana tako, da deluje kot človeški možgan, strokovnjaki za strojno učenje pa ta model pogosto uporabljajo za ustvarjanje rezultatov strojnega učenja.

Vendar to ni edini način strojnega učenja. Nekateri bolj rudimentarni projekti strojnega učenja preprosto vključujejo prikazovanje računalniku široko paleto fotografij (ali dobavo z drugimi neobdelanimi podatki), vnašanje idej skozi postopek uporabe nadzorovanega strojnega učenja in podatkov o oznakah ter računalnik sčasoma lahko razlikuje med različne oblike ali predmeti v vidnem polju. (Za osnove strojnega učenja si oglejte Strojno učenje 101.)

Dve disciplini vrhunskih robov

Za zaključek je strojno učenje dragocen del znanosti o podatkih. Toda podatkovna znanost predstavlja mejo vaste in posledice, v katerih poteka strojno učenje.

Na nek način bi lahko rekli, da se strojno učenje nikoli ne bi zgodilo brez velikih podatkov. Veliki podatki sami po sebi niso ustvarili strojnega učenja - namesto tega, potem ko smo skupaj zbrali toliko podatkov, da skoraj nismo vedeli, kaj bi s tem, so vrhunski možje te bio-simulacijske procese izoblikovali kot napolnjen način zagotavljanja vpogleda.

Še eno dobro pri tem je treba upoštevati, da se lahko podatkovna znanost uporablja na dva glavna načina - lahko vključimo strojno učenje in umetno inteligenco, prepustimo računalnikom, da mislijo namesto nas, ali pa lahko podatke o znanosti vrnemo k bolj človeku usmerjenemu pristopu, kjer računalnik preprosto predstavi rezultate in mi kot ljudje sprejemamo odločitve.

Zato nekateri strokovnjaki, vključno z nekaterimi današnjimi vrhunskimi inovatorji, pozivajo k bolj živahnemu računovodstvu načinov, kako uporabljamo te tehnologije.

"(AI) je sposoben skoraj več kot skoraj kdo ve, stopnja izboljšanja pa je eksponentna," je citiral Elon Musk, hkrati pa opozoril, da strojno učenje in programi AI zahtevajo nadzor.

Vsekakor sta tako podatkovna znanost kot strojno učenje temeljni del napredka, ki ga kot družbe danes dosegamo na področju tehnologije.