Sisällysluettelo:
- Määritelmä - Mitä optinen merkkien tunnistus (OCR) tarkoittaa?
- Techopedia selittää optisen merkkitunnistuksen (OCR)
Määritelmä - Mitä optinen merkkien tunnistus (OCR) tarkoittaa?
Optisella merkkintunnistuksella (OCR) tarkoitetaan sekä tekniikkaa että prosessia, jolla luetaan ja muunnetaan kirjoitetut, painetut tai käsin kirjoitetut merkit konekoodattuun tekstiin tai muuhun, jota tietokone voi käsitellä. Se on osa kuvan tunnistusta ja sitä käytetään laajasti tietomuodon muodossa. Tulo on jonkinlainen painettu asiakirja tai tietue, kuten pankkitiliotteet, myyntilaskut, passit, ansioluettelot ja käyntikortit. Asiakirja joko skannataan tai kuva otetaan, ja ohjelman tehtävänä on tunnistaa merkit ja antaa tulosteet tekstiasiakirjana.
Techopedia selittää optisen merkkitunnistuksen (OCR)
Merkkien optinen tunnistaminen on kielikohtaisten merkkien tunnistaminen tietokoneella analysoimalla kuva, joka on jo tietokoneella luettavissa. Tämä tehdään usein ottamalla ensin kuva asiakirjasta skannaamalla se tai ottamalla digitaalinen kuva. Tämä luo rasterikuvan, joka koostuu tietokoneen ymmärtämästä tiedosta. Erityisesti ohjelmoitujen algoritmien avulla, joista suurin osa käytetään tekoälyn alueella, tietokone tunnistaa kuvan kuviot ja tässä tapauksessa kuviot ovat merkkejä. Ohjelma luo tai tulostaa merkkikoodit, yleensä ASCII, jotka vastaavat tulokuvan tunnistettuja merkkejä. Suurin osa OCR-ohjelmista on koulutettava, jotta ne kykenevät tunnistamaan merkit paremmin.
