Koti Ohjelmisto Äänentunnistustekniikka: hyödyllinen vai tuskallinen?

Äänentunnistustekniikka: hyödyllinen vai tuskallinen?

Sisällysluettelo:

Anonim

Oletko koskaan soittanut yritykseen saadaksesi apua tai maksaaksesi laskun, vain kun tervehdit sitä miellyttävällä äänitetyllä äänellä, joka haluaa keskustella kanssasi - mutta et ymmärrä puolta mitä sanot? Tai ehkä omistat iPhonen, ja vaikka Siri näytti ensin hyvältä liittolaiselta, olet huomannut, että joskus (OK, olkaamme rehellisiä, usein) hän vain ei saa sitä? Äänentunnistustekniikka (VRT), joka tunnetaan myös nimellä puhe tekstiksi, kuuluu yhteiseen ansaan: sillä on potentiaalia olla uskomattoman viileä (ja poika, me juurtumme siihen), mutta useammin se on hampaiden hiominen käyttää turhautumista.


Aikaisemmin tieteiskirjallisuuden piiriin kuuluva idea, äänentunnistus on kasvanut jo lapsenkengistään saakka 1950-luvulla, jolloin Bell Laboratories Audrey -järjestelmä suunniteltiin tunnistamaan yhdellä äänellä puhutut numerot nykyaikaiseen keskusteluelektroniikan verkkoon, jonka kanssa olemme nyt vuorovaikutuksessa. päivittäin - vaihtelevilla tuloksilla.

Jos haluat puhua ihmisen kanssa, paina 0

Monet nykypäivän yritykset käyttävät nyt interaktiivisen puhevastauksen (IVR) järjestelmiä asiakaspalvelupuhelujen käsittelemiseen. Yleisin käyttö on ääni-navigoiduissa valikoissa, mutta jotkut yritykset käyttävät IVR-järjestelmiä, jotka pääsevät asiakastilitietoihin ja vastaavat pieniin kysymyksiin. Valikko IVR-ohjelmistolla on yleensä rajoitettu sanasto, joka voi olla rajoitettu "kyllä", "ei" ja numeroihin. Monimutkaisemmat järjestelmät tunnistavat yrityskohtaiset sanat ja ilmaukset.


Näistä järjestelmistä tulee yhä suositumpia - ainakin yrityksille - yksinkertaisesta syystä: ne ovat kustannustehokkaita. Wall Street Journalin vuoden 2010 raportin mukaan tyypillinen edustajaan päästävä asiakaspuhelu maksaa 3–9 dollaria, kun taas automaattisen järjestelmän kautta hoidettu puhelu maksaa vain viisi – seitsemän senttiä. Ja tietysti, tietokoneohjelmat eivät väsy, soita sairaina tai turhaudu asiakkaiden suhteen (vaikka asiakkaat varmasti turhautuvatkin heihin!).


Onneksi tämä ei aina tarkoita, että IVR vie työpaikat ihmisiltä - tai ainakin, että kaikki ihmiset katoavat puhelinkeskuksista. Nämä ääniohjatut avustajat antavat ihmisille tarkoitetun asiakaspalvelun edustajien olevan tuottavampia ohjaamalla puheluita ja vastaamalla yksinkertaisiin kysymyksiin.


Tietenkin ihmisille, jotka ovat vuorovaikutuksessa näiden tekniikoiden kanssa, se ei aina ole sujuvaa purjehdusta. Teknologia auttaa parantamaan IVR-tekniikan yleisiä ongelmia, kuten aksenttivaikeuksia, mutta automatisoitujen järjestelmien säkkien poisto on edelleen yleinen teema verkossa. Tutustu tähän komediaan hissillä, joka on varustettu äänentunnistuksella, mikä korostaa turhautumista, jota IVR-järjestelmien toimintahäiriöt voivat aiheuttaa.

Henkilökohtaiset puhelinsovellukset: Siri, Google Now

Suurin osa ihmisistä tuntee älypuhelimien äänentunnistuksen. Vaikka suurin osa uusimmista puhelinmalleista tulee VR: stä, niiden suosio - ja tunnettavuus - paisutettiin, kun Apple esitteli Siri, iPhone 4S: n lievästi sarkastisen, äänen aktivoiman "henkilökohtaisen avustajan" vuonna 2011. Google loi pian suoran kilpailijan: Google Nyt Android Jelly Bean -käyttöjärjestelmälle. Molemmissa järjestelmissä on naisten ääniä ja hienostuneita tunnistusominaisuuksia, joiden avulla käyttäjät voivat "puhua" puhelimiinsa rento kielen avulla.


Mutta vaikka nämä järjestelmät ovat huomattavasti kehittyneempiä ja toiminnallisempia kuin edeltäjänsä, ne osoittavat myös, että tekniikalla on vielä pitkä tie kuljettavanaan. Vitseistä Sirin epäonnistumisesta on tullut suosittu Internet-meemi. Yksi mies haastoi jopa Applen väärin mainostamisesta, joka koski Sirin ominaisuuksia.


Ehkä siksi, vaikka Apple loi Sirin edistyneeksi ja informatiiviseksi, VR-ohjelmisto on myös hiukan surkea. Esimerkiksi, jos puhut yhtä elokuvan historian pahamaineisimmista älytekniikan linjoista elokuvasta 1968 "2001: A Space Odyssey" - "avaa pod-lahden ovet" - Siri vastaa joko elokuvan vastauslinjalla ". Olen pahoillani (nimesi). Pelkään, etten voi tehdä sitä "tai tarkemmin sanottuna, " tiedustelupalvelijat eivät koskaan elä niin alas, ilmeisesti. "


Nimelle soittaminen on vain yksi toiminnoista, jotka yrittävät tehdä Siristä rakastamisen helpommaksi ja hiukan inhimillisemmäksi. VR-avustaja voi seurata äänikomentoja soittaakseen, sanellaan ja lähettää tekstejä, suorittaa tietoja Internetissä, etsiä lähikauppoja, antaa ajo-ohjeita ja muuta, kaikki ilman, että sinun täytyy koskea mitään. Puhelin puhuu vastaukset samanaikaisesti ja ne näkyvät näytöllä.


Google Now, Android Jelly Bean -alustan VR-osa, on hyvin samanlainen kuin Siri. Järjestelmä tarjoaa samat laajat tunnistusominaisuudet kääntämällä satunnaisen puheen komennoiksi, joiden avulla käyttäjät voivat soittaa, lähettää tekstejä, suorittaa hakuja, suorittaa laskelmia ja muunnoksia, tarttua sanamäärityksiin, asettaa hälytyksiä, toistaa kappaleita ja saada karttoja ja ohjeita.


Henkilökohtaisten äänesavustajien, kuten Siri ja Google Now, eduista on selvää. Kaikki soittamisesta ja tekstiviestien etsimisestä ja viihteestä on nopeampaa ja helpompaa. Sano vain haluamasi, ja (suurimman osan ajasta) VR-sovellus tarttuu siihen sinulle. VR: n hands-off-tekniikka on erityisen hyödyllinen ajon aikana. Ja vaikka monet ihmiset ovat päättäneet Sirin virheistä, ja kirjoittajat ovat väittäneet, että Google Now'n kyky hoitaa käyttäjien elämää olennaisesti hiukan loukkaavana, useimpien mielestä nämä futuristiset tekniikat ovat aika hienoja.


Tietenkin henkilökohtaiset puhelinsovellukset, kuten Siri ja Google Now, eivät ole kaukana täydellisyydestä - vaikka ne osoittavatkin, mihin tämä tekniikka voisi tulevaisuudessa suuntautua. Tämä tarkoittaa, että jopa kun Siri näyttää väärän vastauksen, todennäköisesti nauramme ja anteeksi hänelle tietäen, että seuraava versio on paljon parempi.

Missä VR putoaa tasaiselle

Jos olet joskus kohdannut IVR: n soitettaessa yritykseksi, olet ehkä huomannut tietyt viestinnän esteet. Jotkut ohjelmat käyttävät robottitekstiä puheeksi, joka kieltää sanat väärin ja vaikeuttaa asioiden ymmärtämistä. Toisilla on herkkyysongelmia, jotka johtavat siihen, että ohjelmisto ei kykene käsittelemään sanojasi, jos olet liian kova, liian pehmeä tai et kuvittele huolellisesti.


Lisäksi monet ihmiset eivät edelleenkään vain tuntea olonsa mukavaksi puhuakseen koneen kanssa. Jos suoritat muutaman haun IVR: llä, kohtaat luetteloita, joissa ihmiset ovat koonneet tapoja ohittaa IVR-järjestelmät ja päästä "oikean ihmisen" puoleen. Nämä ratkaisut vaihtelevat "pitäkää painettaessa 0 operaattorille" "vannomaan koneeseen, kunnes se vie ihmisen". Seurauksena on, että suuri osa viimeaikaisesta kehityksestä IVR-järjestelmissä on tehty siitä, että niistä tulisi ihmisille miellyttävämpiä; Äänten tekeminen sympaattisemmiksi ja vähemmän robottisiksi, helpottaen järjestelmän navigointia ja antamalla soittajille tietää, kuinka kauan koko asia kestää alusta loppuun. Tämä viittaa siihen, että parempi tekniikka on vain puoli taistelua tässä; toinen puoli saa käyttäjät käyttämään aluetta puhumaan koneelle.

Mitä tulevaisuus tuo tullessaan

Näistä haasteista huolimatta äänentunnistustekniikka paranee koko ajan. Sovellukset, kuten Siri ja Google Now, - puutteet ja kaikki - ovat edelleen poikkeuksellisen vaikuttavia suorituskyvyllään, ja useat yritykset laajentavat VR-ominaisuuksia muihin sovelluksiin.


Esimerkiksi Dragon NaturallySpeaking-puhe-tekstiohjelmiston luojat Nuance on jo kehittänyt televisioiden ja autojen ääniohjaukset, ja tämän tekniikan versiot on sisällytetty joihinkin Samsung-televisioihin ja SYNC-viihdejärjestelmiin, joita käytetään tietyissä Ford-ajoneuvoissa.


Ja kun Google ja Apple löytävät edelleen uusia tapoja äänentunnistustekniikoilleen, on todennäköistä, että puhumme yhä enemmän kaikenlaisten päivittäisten koneiden kanssa, televisioistamme aina leivänpaahtimiin. Ja jälleen kerran näyttää siltä, ​​että tieteiskirjallisuus oli oikeassa. Meidän on vain toivottava, että nuovat kirjailijat ovat väärässä yhdestä asiasta. Jos nämä koneet ottavat haltuunsa, saatat olla suurissa vaikeuksissa seuraavan kerran, kun pyydät Siriä "avaamaan pod-lahden ovet".

Äänentunnistustekniikka: hyödyllinen vai tuskallinen?