Klávesové zkratky na tomto webu - základní­
Přeskočit hlavičku portálu


Poslanci budou mít v televizi titulky. V reálném čase je vytvoří počítač

aktualizováno 
Česká televize připravuje od jara příštího roku unikátní službu. Využije systémy na rozpoznávání řeči, aby v reálném čase připravily titulky k vysílanému pořadu. Nejprve budou titulkovány vstupy z parlamentu a postupně se bude služba rozšiřovat.

Nejen neslyšící potěší testování rozpoznávání řeči v České televizi

Vyzkoušeli jste si někdy ovládat třeba váš mobilní telefon pomocí hlasových příkazů? Pak asi víte, že ne vše vždy funguje, tak jak má. A to se jedná pouze o jednotlivá slova. Teď si představte, jak složitý musí být systém, který má zvládnout bezproblémový převod mluvené řeči do textu.

Projekt titulkování v reálném čase probíhá v Česku ve spolupráci s katedrou kybernetiky Západočeské univerzity. Například v USA jsou běžně titulkovány (nikoliv však plně automaticky) reklamní bloky, filmy, ale i talk show. U nás se zatím počítá pouze s přenosy z parlamentu. Později by měly přijít na řadu i sportovní přenosy. Nejen, že pořady s titulky mohou snáze sledovat i někteří neslyšící, ale jsou i vynikající pomůckou při samostudiu daného jazyka. 

Jak celé rozpoznávání probíhá

Aby program na rozpoznávání mohl úspěšně rozpoznávat, je třeba ho pečlivě “natrénovat“. Nejprve se musí provést předzpracování cvičných dat. To zahrnuje anotaci zvukového záznamu a později zpracování anotovaného textu. V případě záznamu z parlamentu je třeba například zpracovat stenografický zápis pro účely tvorby jazykového modelu.

Poté je třeba speciálními programy vytvořit akustický a jazykový model. Tyto modely se dále implementují do tzv. dekodéru. Dekodér je speciální program, který je třeba dále trénovat a nastavovat parametry. Výstupem jsou pak trigramové nebo bigramové modely jazyka určené pro rozpoznávání. Trigramový/bigramový model znamená, že titulky jsou dle spočítané pravděpodobnosti v jazykovém modelu zobrazované a upravované ve trojicích/dvojicích.

Proč je rozpoznávání řeči tak složité?

Slovník 50 000 nejfrekventovanějších slov pokrývá v češtině 90,5 %, v angličtině dokonce 99.3 %.

Slovník 300 000 nejfrekventovanějších slov pokrývá zhruba 97.6 % češtiny. U anglického jazyka je to dokonce 100 %.

Pro pokrytí téměř 100 % českého textu je potřeba slovník 1 500 000 nejfrekventovanějších slov.

Tuto velikost slovníku nutného pro pokrytí českého textu způsobuje obrovské množství ohebných tvarů českých slov. Potencionálně lze od jednoho slovesa odvodit až 300 tvarů, pro podstatné jméno 20 tvarů a pro přídavné jméno 200 tvarů.


Titulky v České televizi

Veřejnoprávní televize má ze zákona povinnost titulkovat 70 % vysílaných pořadů. Nejjednodušší způsob je samozřejmě pořady otitulkovat před odvysíláním. To však jde pouze u pořadů, které nejsou vysílány živě.

Tak také vznikají titulky pro sluchově postižené spoluobčany, tzv. skryté titulky, které lze vyvolat na teletextu ČT.

Vše funguje tak, že si určená osoba poslechne záznam a přepíše veškerou mluvenou řeč do titulků. Ty se pak časově sesynchronizují a nakonec odvysílají s daným pořadem v televizi. Problém nastává u živých pořadů, jako jsou sportovní přenosy, přenosy z tiskových konferencí, z parlamentu a mnohé další. V podstatě jediným řešením by bylo najmout stenografy, kteří by pořady téměř reálně otitulkovali. Problémem je jejich nedostatek a cena jejich práce.

Z těchto důvodů se přistoupilo k vývoji počítačového programu pro tvorbu automatických titulků. Věc však není tak jednoduchá. Rozpoznávání řeči, tak aby bylo alespoň trošku úspěšné, je vázáno na mnoho podpůrných faktorů. V místnosti, kde se řečník nachází, musí být ticho, řečník by měl být v klidu a nejlépe by měl daný text číst. To při sportovních událostech není možné. Zhruba před pěti lety v britské BBC kvůli těmto problémům přistoupili na projekt se stínovým řečníkem. To je člověk, který v klidu přemlouvá původního řečníka. Je to taková obdoba tlumočení z češtiny do češtiny.

Spolupráce s vysokou školou

Na katedře kybernetiky ZČU se zkouší oba přístupy – přímé rozpoznávání a rozpoznávání u stínového řečníka. Úspěšnost automatického titulkování hokejového zápasu je při přímém rozpoznávání 75 % a při přemlouvání stínovým řečníkem přes 90 %. Česká televize rovněž testuje automatické titulkování přenosů z parlamentu, kde úspěšnost je 85 % při přímém rozpoznávání. Rozdíl je dán klidem řečníků, relativním tichem a téměř čteným projevem.

Testovací provoz

Úspěšnost v případě parlamentního záznamu zhruba 85 %. Z tohoto důvodu bude první reálně nasazené automatické titulkování právě na parlamentním záznamu. V České televizi bude probíhat zkušební provoz od jara 2008. Cílem je otestování systému sluchově postiženými.

Katedra kybernetiky chystá i automatické titulkování pro další živé pořady a zkouší nové přístupy. Například hokejové záznamy se budou přemlouvat stínovým řečníkem. Dalším chystaným projektem je automatické titulkování znakovou řečí. Limitujícím faktorem pro všechny tyto úlohy je rozsáhlost českého jazyka a výkonnost počítačů. Jak to v reálu vypadá se můžete podívat na těchto stránkách.

 

Poznámka:

Pod pojmem anotace zvukového záznamu se rozumí přepsání záznamu do textu speciálním programem. Je třeba přesně „říci“ počítači, kde se například komentátor nadechl, kde předal slovo někomu jinému, kde byl velký hluk a podobně. Všechny tyto mimoslovní záznamy se označují speciálními slovy. Například DRUM označuje hluk bubínku v publiku. Zároveň je třeba u cizích slov označit i přesnou výslovnost například New {nů } York{jork}.


Autorka je studentkou katedry kybernetiky Západočeské univerzity.


Autor:


Nejčtenější

Zabil je výbuch ruského tanku v centru Prahy. KSČ ničila životy pozůstalým

Tanky typové řady T-54/55, ten blíž k fotografovi evidentně neschopný pohybu,...

Zatímco na pražské Vinohradské třídě hořel a vybuchoval tank, zmatení ruští vojáci na Václavském náměstí zahájili palbu...

Tento pancíř dá tankistům pocit bezpečí a jistoty. Ale bude to stačit?

SMART PROTech na tanku Leopard 2

Německá firma IBD Deisenroth Engineering (IBD) představila prototyp balistické ochrany SMART PROTech pro obrněná...



Úspěšný start. Sonda míří ke Slunci tak blízko, jako žádná předtím

Úspěšný start rakety Delta IV Heavy 12.8.2018 v 9:31 se sondou Parker Solar...

V neděli ráno se ke Slunci vydala unikátní sonda Parker Solar Probe. Měla by se přiblížit k naší hvězdě podstatně blíže...

Sulfan jako lék? V lidských buňkách možná pomáhá zvrátit stárnutí

Klíč k procesu stárnutí tkví v DNA.

Tým vědců zkoumající jednu z příčin stárnutí oznámil úspěch, a to přímo na lidských buňkách v laboratorních podmínkách....

V noci se dívejte na nebe. Perseidy předvedou pravidelnou podívanou

Perseidy (Irsko, 7. srpna 2009)

Ani letos nás prach z komety Swift-Tuttle nemine a zájemci, kteří vydrží dlouho do noci, se tak mohou těšit na...

Další z rubriky

Novinka od Nvidie vyčistí z fotek šum i zrno. Perfektně a bleskurychle

Nalevo původní zašuměný obrázek vstupující do systému, napravo umělou...

Společnost Nvidia vytrénovala umělou inteligenci tak, že dokáže vyčistit i silně zašuměný a zrnitý obrázek nebo z něj...

Hodinky po dědovi jsou jako napínavá detektivka. Nikdy do nich nefoukejte

Hodinky Doxa

Víte, že uvnitř hodinek nebývají diamanty, i když je to na nich „napsáno“? A proč myslíte, že se do hodinek nesmí...

Švábi v křídle. Jak si Rolls-Royce představuje budoucnost letecké údržby

Pohled na laboratorní „šváby“, na jejichž vývoji pro firmu Rolls Royce pracuje...

Letecká výstava ve Farnborough je největší přehlídkou novinek v oboru. Společnosti si na ni schovávají velké věci,...

Akční letáky
Akční letáky

Prohlédněte si akční letáky všech obchodů hezky na jednom místě!

Najdete na iDNES.cz