Kdy vyhodíme klávesnice a budeme na počítače jen mluvit?

  • 27
Na své nedávné návštěvě Bill Gates předestřel svou vizi komunikace s počítačem pomocí hlasu. Vývojáři již dnes pracují na technologiích přepisu mluveného slova, bezdotykové práce s internetem i komunikačních systémech pro automobily. Kdy odložíme periferie a vystačíme si s mikrofonem?

Příznivci žánru science fiction nadšeně jásají pokaždé, když se v tisku objeví informace o dalším pokroku v oblasti počítačového rozpoznávání hlasu. Ale doby, kdy s PC budeme plynně konverzovat ve stylu Vesmírné Odysey, jsou ještě velmi vzdálené. Zatím se ani sekretářky nemusejí bát, že si jejich nadřízení vystačí při přepisování korespondence s mikrofonem, zvukovou kartou a programovým vybavením. Počítače se především učí hlasu vůbec porozumět a podle pánových příkazů vykonávat jednoduché úkony.

Vize miliardářova

Šéf softwarové společnosti Microsoft Bill Gates ani při své nedávné návštěvě Prahy neopomněl zmínit nejnovější trendy v oblasti práce s počítači, k nimž svět neodvratně směřuje. "Rozeznávání lidského hlasu bude určovat vývoj v IT do roku 2010," prohlásil Gates. Technologie má být obsažena v následující verzi operačního systému Windows Longhorn, která přijde na trh v roce 2005 či 2006. I nejbohatší muž planety ale ví, že počítače se bez klávesnice ještě dlouho neobejdou: "Tohle bude její vhodný doplněk," dodává.

Český diktát? Zřejmě ne

Proč se Bill Gates tak těší, až bude moci klávesnici odhodit? Třeba proto, že se s klávesnicí dosud nespřátelil a, jak uvedl v interview pro stanici RTL, ťukání dopisů dvěma prsty mu trvá kolem čtyř hodin denně. "Naučit se psát na stroji, tedy dnes na klávesnici, však bude ještě po mnoho let efektivnější než hlasový záznam," říká Jaroslav Zaviačič, zástupce ČR v mezinárodní federaci pro zpracování textů Intersteno. Podle jeho slov je v našich podmínkách velmi obtížné vytvořit softwarový nástroj pro diktování do počítače. "Náš jazyk je poměrně komplikovaný a například pouhé slovo 'byli' umíme napsat čtyřmi způsoby," vysvětluje Zaviačič.

Zpracovatelé takových projektů se v současné době zabývají především angličtinou a dalšími nejrozšířenějšími jazyky, které poskytují dostatečně velký trh, který by takový výzkum zaplatil. Mezi ně bohužel naše mateřština nepatří.

Popovídejte si s autem

Zakladatel Microsoftu se však ve svých vizích zdaleka neomezuje na osobní počítače. "Rozeznání řeči bude důležité pro malé přenosné přístroje nebo pro technologie například v automobilech," prohlásil při pražské návštěvě. Také tady zatím ještě můžeme zapomenout na úžasný vůz KITT ze seriálu Knight Rider, ale inteligentní systémy pro automobily již existují. Technologie, která získala název Connected Car, spojuje výhody navigačního systému GPS, přístupu na internet, pomocí bezdrátového rozhraní Bluetooth spolupracuje s PDA a mobilním telefonem.

Hlasová komunikace je obousměrná. Palubní počítač promlouvá na řidiče pomocí syntézy hlasu, může jej zásobovat čerstvými zprávami ze světa, informovat o aktuální dopravní situaci či jej křižovatku po křižovatce provádět neznámým prostředím. Rozpoznávací část Voice Command, používaná také v PDA, zase přijímá povely od řidiče, který se může počítače ptát na cestu, vytáčet hlasem telefonní čísla nebo spustit přehrávání hudby. Autopilot zatím chybí, ale i tak o technologii projevily zájem automobilky BMW, Citroën, Daimler Chrysler, Fiat, Subaru, Honda, Hyundai, Mitsubishi, Toyota, Volvo a některé další.

Co nás čeká zítra?

Hlasové rozhraní se však může týkat také internetové komunikace. Existují standardy X+V 1.2 (XHTML+Voice Profile) a VoiceXML 2.0, které mají odstranit rozdíly mezi mluveným a psaným slovem a přinášejí možnost komunikovat s obsahem webu prostřednictvím hlasu. Díky tomu mohou vývojáři kombinovat umělou řeč, digitalizované audio a rozpoznávání řeči s případným vkládáním požadavků a informací přes tradiční klávesnici a další zařízení. Rozvíjejí se také další varianty bezdotykového ovládání počítače, například pomocí snímání očí kamerou, jež spolu s příslušným softwarovým vybavením dokáže určit, co na monitoru sledujete, a provést příslušný příkaz.

Nastupující technologie v následujících letech přístup uživatele k počítači určitě změní. K cíli ale povede dlouhá cesta, kupříkladu IBM plánuje komerční uvedení bezchybného systému převodu řeči na psaný text na rok 2010. Jedno je tedy jisté: klávesnice, myši, volanty a sekretářky zatím zůstanou na svých místech.