Data Mining

Avtor: Randy Alexander
Datum Ustvarjanja: 26 April 2021
Datum Posodobitve: 24 Junij 2024
Anonim
Data mining на практике. Подводные камни анализа данных / Ксения Петрова / COO dmlabs.org
Video.: Data mining на практике. Подводные камни анализа данных / Ксения Петрова / COO dmlabs.org

Vsebina

Opredelitev - Kaj pomeni Data Mining?

Rudarjenje podatkov je postopek analize skritih vzorcev podatkov glede na različne perspektive za kategorizacijo v koristne informacije, ki se zbirajo in sestavljajo na skupnih območjih, kot so skladišča podatkov, za učinkovito analizo, algoritmi rudarjenja podatkov, olajšanje sprejemanja poslovnih odločitev in druge informacije zahteve za končno zmanjšanje stroškov in povečanje prihodkov.


Rudarjenje podatkov je znano tudi kot odkrivanje podatkov in odkrivanje znanja.

Uvod v Microsoft Azure in Microsoft Cloud | V tem priročniku boste spoznali, kaj sploh pomeni računalništvo v oblaku in kako vam lahko Microsoft Azure pomaga preseliti in voditi vaše podjetje iz oblaka.

Techopedia razlaga Data Mining

Glavni koraki v postopku pridobivanja podatkov so:

  • Izvleči, preoblikovati in naložiti podatke v podatkovno skladišče
  • Shranjevanje in upravljanje podatkov v večdimenzionalnih bazah podatkov
  • Poslovnim analitikom omogočite dostop do podatkov s pomočjo aplikacijske programske opreme
  • Analizirane podatke predstavite v lahko razumljivih oblikah, kot so grafi

Prvi korak pri pridobivanju podatkov je zbiranje ustreznih podatkov, ki so kritični za poslovanje. Podatki o podjetju so transakcijski, neoperativni ali metapodatki. Transakcijski podatki obravnavajo vsakodnevne operacije, kot so prodaja, zaloge in stroški itd. Neoperativni podatki se običajno napovedujejo, metapodatki pa se ukvarjajo z logičnim oblikovanjem baze podatkov. Vzorci in razmerja med podatkovnimi elementi dajejo ustrezne informacije, kar lahko poveča organizacijski prihodek. Organizacije z močnim poudarkom na potrošnikih se ukvarjajo s tehnikami rudarjenja podatkov, ki zagotavljajo jasne slike prodanih izdelkov, cene, konkurenco in demografijo kupcev.


Na primer, maloprodajni velikan Wal-Mart posreduje vse svoje ustrezne podatke v podatkovno skladišče s terabajti podatkov. Do teh podatkov lahko dobavitelji zlahka dostopajo do teh podatkov, kar jim omogoča prepoznavanje vzorcev nakupa kupcev. Ustvarijo lahko vzorce nakupovalnih navad, večino kupljenih dni, najbolj iskane izdelke in druge podatke z uporabo tehnik rudarjenja podatkov.

Drugi korak pri pridobivanju podatkov je izbira ustreznega algoritma - mehanizma, ki ustvarja model rudarjenja podatkov. Splošno delovanje algoritma vključuje prepoznavanje trendov v naboru podatkov in uporabo izhoda za definiranje parametrov. Najbolj priljubljeni algoritmi, ki se uporabljajo za rudarjenje podatkov, so klasifikacijski algoritmi in regresijski algoritmi, ki se uporabljajo za ugotavljanje razmerij med podatkovnimi elementi. Večji ponudniki baz podatkov, kot sta Oracle in SQL, vključujejo algoritme za rudarjenje podatkov, kot sta združevanje in regresijski tress, da zadovoljijo povpraševanje po pridobivanju podatkov.