Sisällysluettelo:
Määritelmä - mitä tietojen louhinta tarkoittaa?
Tietojen louhinta on prosessi, jossa analysoidaan piilotettuja tietomalleja eri näkökulmien mukaan luokittelusta hyödylliseksi informaatioksi, joka kerätään ja kootaan yhteisiin tiloihin, kuten tietovarastoihin, tehokasta analysointia, tiedon louhinnan algoritmeja, liiketoiminnan päätöksenteon helpottamista ja muuta tietoa varten. vaatimukset kustannusten lopulliseksi leikkaamiseksi ja tulojen lisäämiseksi.
Tiedon louhinta kutsutaan myös tiedon etsimiseksi ja tiedon löytämiseksi.
Techopedia selittää Data Miningin
Tärkeimmät tiedon louhintaprosessin vaiheet ovat:
- Pura, muunna ja lataa tiedot tietovarastoon
- Tallenna ja hallinnoi tietoja moniulotteisissa tietokannoissa
- Tarjoa tietojen käyttöoikeus liiketoimintaanalyytikoille sovellusohjelmistojen avulla
- Esitä analysoidut tiedot helposti ymmärrettävissä muodoissa, kuten kuvaajina
Tiedon louhinnan ensimmäinen askel on liiketoiminnan kannalta kriittisen tiedon kerääminen. Yritystiedot ovat joko tapahtuma-, ei-operatiivisia tai metatietoja. Transactional data käsittelee päivittäisiä toimintoja, kuten myyntiä, varastota ja kustannuksia jne. Ei-operatiivinen data ennustetaan yleensä, kun taas metatiedot liittyvät loogiseen tietokannan suunnitteluun. Kuviot ja tietoelementtien väliset suhteet antavat olennaista tietoa, mikä voi lisätä organisaation tuottoja. Organisaatiot, joilla on vahva kuluttajakeskeisyys, käsittelevät tiedon louhintatekniikoita, jotka tarjoavat selkeitä kuvia myytyistä tuotteista, hinnasta, kilpailusta ja asiakkaiden demografisista tiedoista.
Esimerkiksi vähittäiskaupan jättiläinen Wal-Mart lähettää kaikki asiaankuuluvat tietonsa tietovarastoon teratavuilla dataa. Toimittajat pääsevät helposti näihin tietoihin, jotta he voivat tunnistaa asiakkaiden ostamistavat. He voivat luoda malleja ostoksista, useimmista ostoksista päivistä, halutuimmista tuotteista ja muusta tiedosta hyödyntäen tiedon louhintamenetelmiä.
Toinen vaihe tiedon louhinnassa on sopivan algoritmin valinta - mekanismi, joka tuottaa tiedon louhintamallin. Algoritmin yleiseen työskentelyyn sisältyy suuntausten tunnistaminen tietoryhmässä ja tulosteen käyttäminen parametrien määrittämiseen. Tietojen louhintaan käytetyt suosituimmat algoritmit ovat luokittelualgoritmit ja regressioalgoritmit, joita käytetään tunnistamaan tietoelementtien väliset suhteet. Suurimmat tietokantatoimittajat, kuten Oracle ja SQL, sisällyttävät tiedon louhintaalgoritmeja, kuten klusteroinnin ja regressiojännityksen, tietojen louhinnan tarpeiden tyydyttämiseksi.