Koti Audio Mikä on tekstitietojen louhinta? - määritelmä techopediasta

Mikä on tekstitietojen louhinta? - määritelmä techopediasta

Sisällysluettelo:

Anonim

Määritelmä - mitä tekstitietojen louhinta tarkoittaa?

Tekstitietojen louhinta koostuu tekstidokumentin tai resurssin sekoittamisesta arvokkaan jäsennellyn tiedon saamiseksi. Tämä vaatii hienostuneita analyyttisiä työkaluja, jotka käsittelevät tekstiä tiettyjen avainsanojen tai keskeisten tietopisteiden hankkimiseksi suhteellisen raa'ista tai jäsentämättömistä muodoista.

Tekstitiedon louhinta kutsutaan myös tekstin louhinnaksi tai tekstianalyysiksi.

Techopedia selittää tekstitietojen louhinnan

Tekstitiedon louhinnassa suunnitellut järjestelmät käyttävät esimerkiksi taksonomioita ja leksiaalista analyysiä määrittääkseen, mitkä tekstidokumentin osat ovat arvokkaita louhituna tiedona. Tilastolliset mallit ovat yleisesti hyödyllisiä, ja järjestelmät voivat käyttää myös heuristiikkaa tai algoritmisia arvauksia yrittääkseen määrittää, mitkä tekstin osat ovat tärkeitä. Muita ohjausjärjestelmiä ovat merkinnät ja avainsana-analyysi, missä työkalut etsivät erityisiä oikeita substantiivit tai muut tunnisteet ja avainsanat selvittääkseen mitä kirjoitetaan.

Toista tekstin louhinnan ainutlaatuista komponenttia kutsutaan usein tuntemusanalyysiksi. Sentiment-analyysissä, joka on yleensä paljon vaikeampaa kuin tilastollinen analyysi, analyyttiset työkalut yrittävät selvittää kirjoitetun tekstin taustalla vallitsevan mielialan tai tunteen ja muut näkökohdat siihen, mitä se käsittelee, hyvin subjektiivisella ja intuitiivisella tasolla. Kun tekoälytyökaluja ilmaantui, tuntemusanalyysissä on edistytty paljon, niin että nykyaikainen tekstitietojen louhinta on enemmän kuin vain kvantitatiivisten referenssien keräämistä ja siihen sisältyy korkean tason käsitteellisten mallien tuominen tekstien louhintaan uusien ja ainutlaatuisten tapojen selvittämiseksi. koota arvokasta tietoa.

Mikä on tekstitietojen louhinta? - määritelmä techopediasta