Sisällysluettelo:
Määritelmä - Mitä tekstianalyysi tarkoittaa?
Tekstianalyysi on yleinen käytäntö soveltaa algoritmeja tai ohjelmia tekstiin kyseisen tekstin analysoimiseksi.
Tekstianalytiikkaa kutsutaan myös tekstin louhinnaksi.
Techopedia selittää tekstianalyysin
Tekstianalyysin avulla tietokoneet jäsentävät tekstiä datan lukemisen sijasta.
Kehittäjät ovat luoneet minkä tahansa määrän tekstianalyysialgoritmeja, jotka tekevät tekstistä erilaisia asioita kerätäkseen tietoa tekstistä. Esimerkiksi tekstianalyysit ovat olleet erittäin tärkeitä luonnollisessa kielenkäsittelyssä, jossa edelläkävijäkehitys pyrkii auttamaan tietokoneita ymmärtämään ihmisen puhetta.
Yksi tapa puhua joistakin tekstianalyysiohjelmista on, että ne "poistavat semantiikan" tekstistä. Semanttinen merkinnät ovat osa sitä, mikä antaa ihmisille mahdollisuuden lukea tekstiä luonnollisesti. Semantiikan poistaminen voi antaa jäsentyneemmän tuloksen, jota tietokoneen on helpompi analysoida.
Syvemmälle tarkastellaksesi tekstin louhinta- tai tekstianalyysiohjelmia voi olla hyödyllistä tutkia eroa semanttisten ohjelmointikielten tyyppien välillä, joihin ihmiset kirjoittavat, ja konekielen, joka on mitä tietokoneet lukevat. Se on käsitys tekstianalytiikassa: esimerkiksi tekstianalyysiohjelma voi käydä läpi tekstin ja antaa numeroita tietyille sanoille ja ilmauksille, jotta saadaan laskettu tulos käytettäväksi analytiikkarajapinnassa, jonka ihmiset sitten tulkitsevat.




