Nenamáhejte si hlasivky, počítač bude mluvit za vás

  • 8
Systémy na rozpoznávání mluveného slova již existují. Technologie z laboratoří NASA ale zjistí, co se teprve chystáte říci! Pomocí senzorů na krku umí systém nejen rozpoznávat slova, ale také vykonávat různé povely - aktuálně třeba brouzdat internetem bez klávesnice a myši.

Vědci Národní americké kosmické agentury (NASA) objevili způsob, jak počítačově zachytit a zpracovat krkem procházející nervové signály, které mají na starosti lidskou řeč. Zjistili, že malé senzory, umístěné pod bradou z každé strany ohryzku, mají tendenci zachycovat nervové signály, které může počítačový program překládat na jednotlivá slova. Systémy tzv. "subvokální řeči" by mohly být podle vyjádření odborníků použity ve skafandrech, napomáhat komunikaci na hlučných místech nebo se stát součástí aplikací pro rozpoznávání řeči.

"Co zde analyzujeme je tichá, či chcete-li neslyšitelná řeč, jako když osoba čte potichu nebo rozpráví sama k sobě," říká Chuck Jorgensen, vědec, jehož tým vyvíjí systém rozpoznávání subvokální mluvy v Amesu, výzkumném středisku NASA. "Člověk používající subvokální systém v duchu sestavuje fráze a vlastně tak mluví naprosto neslyšně, rty se nepohybují, ale jazyk a hlasivky přesto přijímají řečové signály z mozku," objasňuje Jorgensen.

Photo © NASA Ames Research Center, Dominic Hart

Slabikář na úvod

Na počátku experimentu naučili vědci speciální počítačový program rozeznávat šest slov a deset číslic, které vývojáři v duchu opakovali. První výsledky rozpoznávání slov byly na 92 přesné. První neslyšitelná slova, která se systém naučil, byla "stůj", "jdi", "vlevo", "vpravo", "alfa" a "omega" a číslice od nuly do devítky. Vyslovováním těchto výrazů v duchu byli vědci schopni provádět jednoduché vyhledávání na internetových stránkách, browser ovládali pomocí číselné řady reprezentující abecedu.

"Vzali jsme celou abecedu a vložili ji do matrice - jako do kalendáře. Očíslovali jsme sloupce a řady, takže každé písmeno jsme mohli identifikovat pomocí dvou čísel," řekl Jorgensen. "Takto jsme mlčky vyhláskovali 'NASA' a dotaz zadali do vyhledávače. Pak jsme elektronicky očíslovali nalezené stránky a stejnou metodou jsme se dostali na kýženou adresu. Tímto způsobem jsme mohli pracovat s internetem, aniž bychom potřebovali myš nebo klávesnici," vysvětlil Jorgensen.

Následující pokus bude spočívat v ovládání mechanického zařízení pomocí jednoduché sady příkazů. Jorgensenův tým plánuje využít simulaci marťanského vozítka a neslyšnými povely určovat směr jízdy.

Photo © NASA Ames Research Center, Dominic Hart

Perspektiva

Podle vědců systém našel uplatnění například v hlučném prostředí - lidé by si mohli v prostředcích hromadné dopravy nerušeně vyřizovat soukromé hovory. Ale nejen tam: "Pokročilý systém ovládání svalů by mohl pomoci zraněným astronautům manipulovat se stroji. Kupříkladu pokud mají členové posádky po dlouhém pobytu ve stavu beztíže ochablé svalstvo, mohou vyslat signály řídící aplikaci, která by jim asistovala při přistáním. "Z toho vyplývá, že podobný systém by mohl značně usnadnit život tělesně postiženým," nastiňuje Jorgensen budoucí uplatnění.

Vědci při výzkumu signálů studují komplexní vzorky nervových signálů, aby odhalili mechanismy ovládající hlasivky, mimické svaly a pozici jazyku. "Získané vzorky zesilujeme, odstraňujeme ruchy a zkoumáme nosný signál, abychom mohli rozlišit slovo od slova. Počítač pak může buď provést určitý povel, nebo výraz vyslovit," říká Jorgensen.

Po zesílení dokáže počítač číst signály a oddělovat jednotlivá slova. "Klíčovou roli zde hrají senzory, zpracování signálu a rozpoznávání vzorků. I když se zatím jedná jen o několik slov, je to velký úspěch. Chceme náš experiment dále rozvíjet, cílem je naučit počítač všechna anglická slovíčka a sestavit program pro plné rozpoznávání řeči," uzavírá věděc. Tým odborníků nyní testuje nový typ bezdotykových senzorů, které mohou číst signály ze svalů i přes vrstvu oblečení.

Fotografie: NASA Ames Research Center, Dominic Hart