Koti tietokannat Mitä tietokannat ovat tietokannoissa (kdd)? - määritelmä techopediasta

Mitä tietokannat ovat tietokannoissa (kdd)? - määritelmä techopediasta

Sisällysluettelo:

Anonim

Määritelmä - Mitä tietokannat tietokannoissa (KDD) tarkoittavat?

Tietojen löytäminen tietokannoissa (KDD) on prosessi, jolla hyödyllinen tieto löydetään tietokokoelmasta. Tämä laajalti käytetty tiedon louhintatekniikka on prosessi, joka sisältää tietojen valmistelun ja valinnan, tietojen puhdistamisen, ennakkotietojen sisällyttämisen tietokokonaisuuksiin ja tarkkaiden ratkaisujen tulkinnan havaittujen tulosten perusteella.

Tärkeimpiin KDD-sovellusalueisiin kuuluvat markkinointi, petosten havaitseminen, tietoliikenne ja valmistus.

Techopedia selittää tietokantojen löytämisen tietokannoissa (KDD)

Tiedon louhinta ja tiedon löytäminen suoritettiin perinteisesti manuaalisesti. Ajan myötä monien järjestelmien tietomäärä kasvoi yli teratavun kokoiseksi, eikä sitä voitu enää ylläpitää käsin. Lisäksi minkä tahansa liiketoiminnan onnistuneelle olemassaololle tietojen taustalla olevien mallien löytämistä pidetään välttämättömänä. Seurauksena on kehitetty useita ohjelmistotyökaluja piilotetun tiedon löytämiseksi ja oletusten tekemiseksi, jotka olivat osa tekoälyä.

KDD-prosessi on saavuttanut huippunsa viimeisen 10 vuoden aikana. Siinä on nyt monia erilaisia ​​lähestymistapoja löytöihin, joihin kuuluvat induktiivinen oppiminen, Bayesin tilastot, semanttisen kyselyn optimointi, asiantuntijajärjestelmien tiedon hankkiminen ja informaatioteoria. Perimmäisenä tavoitteena on saada korkeatasoinen tieto matalan tason tiedoista.

KDD sisältää monialaista toimintaa. Tähän sisältyy tietojen tallennus ja käyttö, algoritmien skaalaaminen massiivisiin tietojoukkoihin ja tulosten tulkinta. Tietojen varastointiin sisältyvä tietojen puhdistus ja tietojen käyttöprosessi helpottavat KDD-prosessia. Tekoäly tukee myös KDD: tä löytämällä empiirisiä lakeja kokeiluista ja havainnoista. Tietoihin tunnistettujen kuvioiden on oltava kelvollisia uudessa tiedossa ja niissä on oltava jonkin verran varmuutta. Näitä malleja pidetään uutena tietona. Koko KDD-prosessiin kuuluvat vaiheet ovat:

  1. Tunnista KDD-prosessin tavoite asiakkaan näkökulmasta.
  2. Ymmärrä mukana olevat sovellusalueet ja tarvittavat tiedot
  3. Valitse kohdetietojoukko tai tietoryhmien alajoukko, joille etsintä suoritetaan.
  4. Puhdista ja esikäsitellä tiedot päättämällä strategioista puuttuvien kenttien käsittelemiseksi ja tietojen muuttamiseksi vaatimusten mukaisesti.
  5. Yksinkertaista tietojoukkoja poistamalla ei-toivotut muuttujat. Sitten analysoi hyödylliset ominaisuudet, joita voidaan käyttää datan esittämiseen tavoitteesta tai tehtävästä riippuen.
  6. Yhdistä KDD-tavoitteet tietojen louhintamenetelmiin piilotettujen kuvioiden ehdottamiseksi.
  7. Valitse tietojen louhintaalgoritmit piilotettujen kuvioiden löytämiseksi. Tämä prosessi sisältää päätöksen tekemisen, mitkä mallit ja parametrit saattavat olla sopivia koko KDD-prosessille.
  8. Etsi mielenkiintoisia malleja tietystä esitysmuodosta, joihin kuuluvat luokitussäännöt tai puut, regressio ja klusterointi.
  9. Tulkitse olennainen tieto kaivoskuvioista.
  10. Käytä tietoa ja liitä se toiseen järjestelmään jatkotoimenpiteitä varten.
  11. Dokumentoi se ja tee raportteja kiinnostuneille.
Mitä tietokannat ovat tietokannoissa (kdd)? - määritelmä techopediasta