"Voice" naudojimas kaip įvesties metodas
Kalbos atpažinimas yra technologija, kuri leidžia kalbėti įvesties į sistemas. Jūs kalbate su savo kompiuteriu, telefonu ar įrenginiu, ir jis naudoja tai, ką sakėte kaip įvesties elementą, norint sukelti tam tikrą veiksmą. Ši technologija naudojama pakeisti kitus įvesties būdus, pvz., Rašyti, spustelėti ar pasirinkti kitus būdus. Tai yra priemonė padaryti įrenginius ir programinę įrangą patogesnę vartotojui ir padidinti produktyvumą.
Yra daugybė programų ir sričių, kuriose kalbos atpažinimas naudojamas, įskaitant karinį, kaip pagalbą sutrikusiems žmonėms (įsivaizduokite, kad žmogus yra suluošintas ar neturite rankų ar pirštų), medicinos srityje, robotose ir tt artimiausioje ateityje. beveik visi bus veikiami kalbos atpažinimo dėl to paplitę tarp bendrų prietaisų, tokių kaip kompiuteriai ir mobilieji telefonai.
Kai kurie išmanieji telefonai įdomiai naudoja kalbos atpažinimą. "IPhone" ir "Android" įrenginiai yra pavyzdžiai. Per jas galite pradėti skambutį kontaktiniam asmeniui, tiesiog gaudami žodines instrukcijas, pvz., "Skambinkite biure". Kitos komandos taip pat gali būti linksminamos, pvz., "Įjunkite" Bluetooth ".
Kalbėjimo atpažinimo problemos
Kalbėjimo atpažinimas, jo versija, vadinama kalba į tekstą (STT), jau ilgą laiką buvo naudojama verčiant žodinius žodžius į tekstą. "Jūs kalbate, tai įvyksta", kaip sakė "ViaVoice" savo laukelyje. Tačiau yra viena problema su STT, kaip mes tai žinome. Daugiau nei 10 metų aš bandžiau "ViaVoice", ir mano kompiuteryje trunka ne savaitę. Kodėl? Tai buvo labai netiksli, ir aš baigiau daugiau laiko ir energijos kalbėti ir taisyti, nei rašyti viską. "ViaVoice" yra viena iš geriausių pramonės šakų, taigi įsivaizduok visa kita. Technologija subrendo ir pagerėjo, tačiau kalbant tekstui žmonės vis dar klausia klausimų. Vienas iš pagrindinių sunkumų yra didžiulis žmonių pasikeitimas žodžiais.
Kalbos pripažinimui turi būti ne visos kalbos, o dažnai nepalaikomi ir anglų kalbos. Todėl dauguma įtaisų, kuriuose veikia kalbos atpažinimo programinė įranga, pagrįstai veikia tik anglų kalba.
Tam tikrais atvejais kalbos atpažinimo sunku išdėstyti dėl aparatūros reikalavimų rinkinio. Jums reikia pakankamai protingo mikrofono, kad būtų galima nufotografuoti foninį triukšmą, tačiau tuo pat metu pakankamai galingas, kad natūraliai būtų galima įrašyti balso įrašą.
Kalbėdamas apie fono triukšmą, tai gali sukelti visos sistemos nesėkmę. Dėl to daugeliu atvejų kalbos atpažinimas nebeveikia dėl triukšmo, kuris nėra vartotojo valdymas.
Kalbos atpažinimas yra geresnis kaip naujų telefonų ir ryšių technologijų, pvz., VoIP, įvesties metodas, o ne kaip masinio teksto įvedimo našumo priemonė.
Kalbos atpažinimo programos
Ši technologija populiarėja daugelyje sričių ir buvo sėkminga:
- Įrenginio valdymas. Tiesiog sakydamas "OK Google" Android telefonui, paleidžiama sistema, kuri visi yra jūsų balso komandų ausis.
- "Car Bluetooth" sistemos. Daugelyje automobilių įrengta sistema, jungianti savo radijo mechanizmą su "smartphone" per "Bluetooth". Tada galite skambinti ir priimti skambučius neliesdami savo išmaniojo telefono ir netgi galite skambinti numeriais tiesiog sakydami juos.
- balso transkripcija. Teritorijose, kuriose žmonėms reikia daug įvesti, kai kurios protingos programinės įrangos užfiksuos jų žodinius žodžius ir perrašys juos į tekstą. Tai galioja tam tikra teksto apdorojimo programine įranga. Balso transkripcija taip pat veikia su vaizdo balso pašto .