Kakšna je razlika med velikimi podatki in Hadoopom?

Avtor: Judy Howell
Datum Ustvarjanja: 5 Julij. 2021
Datum Posodobitve: 23 Junij 2024
Anonim
Kakšna je razlika med velikimi podatki in Hadoopom? - Tehnologija
Kakšna je razlika med velikimi podatki in Hadoopom? - Tehnologija

Vsebina

V:

Kakšna je razlika med velikimi podatki in Hadoopom?


A:

Razlika med velikimi podatki in odprtokodnim programom Hadoop je izrazita in temeljna. Prvi je sredstvo, pogosto zapleteno in dvoumno, medtem ko je drugi program, ki uresničuje niz ciljev in ciljev za ravnanje s tem sredstvom.

Veliki podatki so preprosto veliki nabori podatkov, ki jih podjetja in druge stranke sestavljajo, da služijo točno določenim ciljem in operacijam. Veliki podatki lahko vključujejo veliko različnih vrst podatkov v različnih oblikah. Podjetja lahko na primer naložijo veliko dela pri zbiranju tisoč podatkov o nakupih v oblikah valut, o identifikatorjih strank, kot so ime ali številka socialnega zavarovanja, ali o informacijah o izdelku v obliki številk modelov, prodajnih številk ali inventarnih številk. Vse to ali katero koli drugo veliko množico informacij lahko imenujemo veliki podatki. Praviloma je surovo in nesortirano, dokler se ne da skozi različna orodja in sredstva za obdelavo.

Hadoop je eno izmed orodij, namenjenih ravnanju z velikimi podatki. Hadoop in drugi programski izdelki delujejo tako, da razlagajo ali razčlenijo rezultate iskanja velikih podatkov s pomočjo posebnih lastniških algoritmov in metod. Hadoop je odprtokodni program z licenco Apache, ki ga vzdržuje globalna skupnost uporabnikov. Vključuje različne glavne komponente, vključno z naborom MapReduce in sistemom datotek Hadoop, ki je razporejen (HDFS).


Ideja programa MapReduce je ta, da lahko Hadoop najprej preslika velik obseg podatkovnih podatkov in nato za določene rezultate zmanjša vsebino te vsebine. Funkcijo zmanjšanja lahko predstavljamo kot nekakšen filter za neobdelane podatke. Sistem HDFS nato deluje, da distribuira podatke po omrežju ali jih po potrebi premika.

Skrbniki baz podatkov, razvijalci in drugi lahko uporabljajo različne funkcije Hadoopa za obravnavo velikih podatkov na poljuben način. Na primer, Hadoop se lahko uporablja za sledenje podatkovnim strategijam, kot sta združevanje in ciljanje z neenakomernimi podatki ali podatki, ki se ne prilegajo tradicionalni tabeli ali se dobro odzovejo na preproste poizvedbe.