Tehnologija prepoznavanja glasu: koristna ali boleča?

Avtor: Judy Howell
Datum Ustvarjanja: 28 Julij. 2021
Datum Posodobitve: 1 Julij. 2024
Anonim
High Density 2022
Video.: High Density 2022

Vsebina


Odvzem:

Interakcija s pogovorno elektroniko postaja vse bolj pogosta - in nujna. A zaenkrat so rezultati odločno mešani.

Ste že kdaj poklicali podjetje, da bi dobili kakšno pomoč ali plačali svoj račun, da vas pozdravi le prijeten posnet glas, ki želi pogovoriti z vami - a ne morete razumeti polovice tega, kar govorite? Ali ste morda lastnik iPhone-a, in čeprav se je Siri najprej zdela dobra zaveznica, se zavedate, da včasih (v redu, pogosto sem iskren), je preprosto ne razume? Tehnologija prepoznavanja glasu (VRT), znana tudi kot govor-do-, sodi v skupno past: ima potencial, da je neverjetno kul (in fant, ali se za njo ukoreninimo), pogosteje pa je to vaja za brušenje zob. v frustraciji.

Nekoč ideja, ki je spadala v sfero znanstvene fantastike, je prepoznavnost glasu zrasla od svojega začetka v petdesetih letih prejšnjega stoletja, ko je bil sistem Bell Laboratories Audrey zasnovan za prepoznavanje števk, izrečenih v en glas, v sodobno mrežo pogovorne elektronike, s katero zdaj komuniciramo vsakodnevno - z mešanimi rezultati.

Če želite govoriti s človekom, pritisnite 0

Mnoga današnja podjetja zdaj uporabljajo sisteme, imenovane interaktivni govorni odziv (IVR) za obravnavo klicev s strankami. Najpogosteje se uporabljajo v menijih za glasovno krmarjenje, vendar nekatera podjetja uporabljajo sisteme IVR, ki imajo dostop do informacij o računu stranke in odgovarjajo na manjša vprašanja. Programska oprema v meniju IVR ima običajno omejen besednjak, ki je lahko omejen na "da", "ne" in številke. Bolj zapleteni sistemi lahko prepoznajo besede in stavke, specifične za podjetje.

Ti sistemi postajajo bolj priljubljeni - vsaj za podjetja - iz preprostega razloga: so stroškovno učinkoviti. Glede na poročilo iz leta 2010, ki ga je objavil Wall Street Journal, običajni klic stranke, ki doseže zastopnika, stane med 3 in 9 dolarjev, medtem ko klic, opravljen prek avtomatiziranega sistema, stane le pet do sedem centov. In seveda, da se računalniški programi ne naveličajo, pokličejo bolne ali postanejo frustrirani s strankami (čeprav stranke zagotovo postanejo frustrirane zaradi njih!).

Na srečo to še vedno ne pomeni, da IVR odvzema delovna mesta ljudem - ali vsaj, da vsi izginjajo iz klicnih centrov. Ti pomočniki z glasovnim aktiviranjem omogočajo ljudem za pomoč strankam, da so bolj učinkoviti z usmerjanjem klicev in odgovarjanjem na preprosta vprašanja.

Seveda za človeške uporabnike, ki komunicirajo s temi tehnologijami, ni vedno gladko jadranje. Tehnologija pomaga izboljšati običajne težave v tehnologiji IVR, na primer težave z poudarki, vendar je odstranjevanje avtomatiziranih sistemov še vedno pogosta tema v spletu. Oglejte si ta komični skeč o dvigalu, opremljenem s prepoznavanjem glasu, ki poudarja frustracijo, ki jo lahko povzročijo okvare v sistemih IVR.

Aplikacije za osebne telefone: Siri, Google Now

Večina ljudi je seznanjena s prepoznavanjem glasu za pametne telefone. Medtem ko večina najnovejših modelov telefonov prihaja z VR, je njihova priljubljenost in razvpitost popustila, ko je Apple leta 2011 predstavil Siri, blago sarkastično glasno aktiviran "osebni asistent" za iPhone 4S. Google je kmalu ustvaril neposrednega tekmeca: Google Zdaj za Android Jelly Bean OS. Oba sistema odlikujeta ženski glas in izpopolnjene funkcije prepoznavanja, ki uporabnikom omogočajo, da "govorijo" s svojimi telefoni s priložnostnim jezikom.

Toda čeprav so ti sistemi bistveno bolj izpopolnjeni in funkcionalni kot njihovi predhodniki, tudi kažejo, da ima tehnologija še dolgo pot. Šale o Sirisovi odpovedi so postale priljubljen internetni meme. En mož je celo tožil Apple zaradi lažnega oglaševanja glede zmogljivosti Siris.

Mogoče je zato, čeprav je Apple ustvaril Siri kot napredno in poučno, pa je VR programska oprema tudi nekoliko na trdni strani. Če na primer govorite o eni od najbolj zloglasnih linij obveščevalne tehnologije v zgodovini kinematografa iz filma iz leta 1968 "2001: vesoljska odiseja" - "odprite vrata pod zalivom" - Siri se bo odzvala bodisi z odzivno vrstico iz filma, " Žal mi je (vaše ime), bojim se, da tega ne morem storiti, "ali bolj sarkastično", očitno obveščevalni agenti tega ne bomo nikoli živeli. "

Klicanje vas po imenu je le ena od funkcij, ki skuša Siri olajšati ljubezen in nekoliko bolj človeško. Pomočnik VR lahko sledi govornim ukazom za klicanje, diktiranje in spuščanje, internetno iskanje informacij, iskanje bližnjih trgovin, dajanje navodil za vožnjo in še kaj, ne da bi se bilo treba ničesar dotikati. Telefon hkrati izgovori odgovore in se prikaže na zaslonu.

Google Now, VR del platforme Android Jelly Bean, je zelo podoben Siri. Sistem ponuja enake široke zmožnosti prepoznavanja s prevajanjem priložnostnega govora v ukaze, ki uporabnikom omogočajo klicanje, opravljanje iskanj, izvajanje izračunov in pretvorb, prijemanje definicij besed, nastavitev alarmov, predvajanje pesmi ter pridobivanje zemljevidov in navodil.

Pri osebnih glasovnih pomočnikih, kot sta Siri in Google Now, so prednosti očitne. Vse od klicanja in iskanja do iskanja in zabave je hitrejše in lažje. Povejte samo, kaj želite, in VR aplikacija večinoma za vas. Prostoročna tehnologija VR je še posebej koristna med vožnjo. In čeprav je veliko ljudi razkrilo pomanjkljivosti Sirisa in pisci trdijo, da je sposobnost Google Nows, da v bistvu vodi življenje uporabnikov, grozna in malce žaljiva, večina ljudi še vedno meni, da so te futuristične tehnologije precej kul.

Seveda aplikacije za osebne telefone, kot sta Siri in Google Now, še zdaleč niso popolne - čeprav resnično kažejo, kam bi lahko v prihodnosti usmerili to tehnologijo. To pomeni, da bi se tudi takrat, ko bo Siri našel napačen odgovor, verjetno smejali in ji oprostili, vedoč, da bo naslednja različica veliko boljša.

Kjer VR pade ravno

Če ste kdaj poklicali podjetje IVR, ko ste poklicali podjetje, ste morda opazili nekatere ovire pri komunikaciji. Nekateri programi uporabljajo robotski govor, ki napačno izgovarja besede in otežuje razumevanje stvari. Drugi imajo težave z občutljivostjo, zaradi česar programska oprema ne more obdelati, kar govorite, če ste preglasni, premehki ali ne previdno izgovorite.

Poleg tega se mnogi ljudje še vedno ne počutijo udobno v pogovoru s strojem. Če izvedete nekaj iskanj po IVR, boste na seznamih srečanj ljudi pripravili načine za obhod sistemov IVR in prišli do "prave osebe". Te rešitve segajo od "nadaljuj s pritiskom na 0 za operaterja" do "prisega na stroj, dokler ne ugotovi človeka." Posledično se je velik del nedavnega razvoja sistemov IVR vrtel okoli tega, da so bolj prijetni za ljudi; s čimer so glasovi bolj naklonjeni in manj robotizirani, sistem je lažji za krmarjenje in klicateljem dal vedeti, kako dolgo bo trajalo vse od začetka do konca. To kaže, da je boljša tehnologija tu le polovica bitke; druga polovica je pridobivanje uporabnikov na krovu, ko govorijo s strojem.

Kaj ima prihodnost

Kljub tem izzivom tehnologija prepoznavanja glasu ves čas izboljšuje. Aplikacije, kot sta Siri in Google Now - pomanjkljivosti in vse -, so še vedno izjemno impresivne pri svojih zmogljivostih, zato številne družbe širijo zmogljivosti VR na druge aplikacije.

Na primer, Nuance, ustvarjalci programske opreme Dragon NaturallySpeaking za govor, je že razvil glasovni nadzor za televizorje in avtomobile, različice te tehnologije pa so vključene v nekatere televizorje Samsung in razvedrilne sisteme SYNC, ki se uporabljajo v določenih Fordovih vozilih.

In ker Google in Apple še naprej najdeta nove načine uporabe tehnologij za prepoznavanje glasu, je verjetno, da se bodo vse pogosteje pogovarjali z vsemi vsakodnevnimi stroji, od naših televizorjev do toasterjev. In še enkrat se zdi, da je bila znanstvena fantastika prava. No samo upam, da so se tisti pametni pisci zmotili ene stvari. Če te stroje prevzamejo, boste lahko naslednjič, ko boste od Siri zaprosili, da "odpre vrata vrat podstavka" v velikih težavah.