Koti Ohjelmisto Mikä on puhesynteesi? - määritelmä techopediasta

Mikä on puhesynteesi? - määritelmä techopediasta

Sisällysluettelo:

Anonim

Määritelmä - mitä puhesynteesi tarkoittaa?

Puhesynteesi on ihmisen puheen keinotekoinen simulointi tietokoneella tai muulla laitteella. Äänentunnistuksen vastapuhetta, puhesynteesiä käytetään enimmäkseen tekstitiedon kääntämiseen äänitiedoiksi ja sovelluksissa, kuten puhekäyttöiset palvelut ja mobiilisovellukset. Tämän lisäksi sitä käytetään myös aputekniikassa auttamaan näkövammaisia ​​henkilöitä tekstin sisällön lukemisessa.

Techopedia selittää puhesynteesin

Homer Dudleyn VODERia, joka perustui Bell Laboratoriesin vokooderiin, pidetään ensimmäisenä täysin toimivana äänen syntetisaattorina. Puhesynteesissä käytetty tietokone tunnetaan puhesyntetisaattorina tai puhetietokoneena. Puhetietokoneen laatua arvioidaan usein sen samankaltaisuuden perusteella kuin ihmisen ääni. Useimmissa tietokoneen käyttöjärjestelmissä on ollut puhesyntetisaattoreita 1990-luvun alusta lähtien. Syntetisoitu puhe luodaan yleensä tallennetun puheen ketjuttavien kappaleiden avulla, jotka sisältyvät tietokantaan.

Puhesynteesin alkuvaihe on esikäsittely, joka eliminoi epäselvyydet, jotka ympäröivät tietyn sanan lukemistapaa, ja joka sisältää myös homografien käsittelyn. Puhesynteesin seuraavassa vaiheessa tietokone ottaa foneemien avulla muuntaa tekstin äänisarjaksi. Viimeiseen vaiheeseen sisältyy ihmisten nauhoitusten tai äänentoistotekniikoiden käyttö ihmisen äänimekanismin jäljittelemiseksi ja koko tekstin lukemiseksi. Yksi suosituimmista puhesynteesin haaroista on audiovisuaalinen puhesynteesi tai multimodaalinen puhesynteesi, joka käyttää tiukasti synkronoituja animoituja kasvoja täydentämään syntetisoitua puhetta. Multimodaalinen puhesynteesi sisältää myös lisäominaisuuksia, kuten sanattomat vihjeet puheeseen auttamaan kommunikoimaan käyttäjän sanoja entistä tarkemmin. Monien puhesynteesijärjestelmien avulla käyttäjät voivat valita äänityypin, kuten miehen tai naisen.

Suurin osa puhesynteesijärjestelmistä pystyy lukemaan tekstiä ja tuottamaan niitä erittäin älykkäästi, vaikka ääni voi toisinaan olla tylsä. Puhesynteesiä on kuitenkin vielä kehitettävä kyky jäljitellä täysin ihmisen intonaatioiden ja kadenssien laaja kirjo.

Mikä on puhesynteesi? - määritelmä techopediasta