Premium

Získejte všechny články mimořádně
jen za 49 Kč/3 měsíce

Poslanci budou mít v televizi titulky. V reálném čase je vytvoří počítač

Česká televize připravuje od jara příštího roku unikátní službu. Využije systémy na rozpoznávání řeči, aby v reálném čase připravily titulky k vysílanému pořadu. Nejprve budou titulkovány vstupy z parlamentu a postupně se bude služba rozšiřovat.

Nejen neslyšící potěší testování rozpoznávání řeči v České televizi

Vyzkoušeli jste si někdy ovládat třeba váš mobilní telefon pomocí hlasových příkazů? Pak asi víte, že ne vše vždy funguje, tak jak má. A to se jedná pouze o jednotlivá slova. Teď si představte, jak složitý musí být systém, který má zvládnout bezproblémový převod mluvené řeči do textu.

Projekt titulkování v reálném čase probíhá v Česku ve spolupráci s katedrou kybernetiky Západočeské univerzity. Například v USA jsou běžně titulkovány (nikoliv však plně automaticky) reklamní bloky, filmy, ale i talk show. U nás se zatím počítá pouze s přenosy z parlamentu. Později by měly přijít na řadu i sportovní přenosy. Nejen, že pořady s titulky mohou snáze sledovat i někteří neslyšící, ale jsou i vynikající pomůckou při samostudiu daného jazyka. 

Jak celé rozpoznávání probíhá

Aby program na rozpoznávání mohl úspěšně rozpoznávat, je třeba ho pečlivě “natrénovat“. Nejprve se musí provést předzpracování cvičných dat. To zahrnuje anotaci zvukového záznamu a později zpracování anotovaného textu. V případě záznamu z parlamentu je třeba například zpracovat stenografický zápis pro účely tvorby jazykového modelu.

Poté je třeba speciálními programy vytvořit akustický a jazykový model. Tyto modely se dále implementují do tzv. dekodéru. Dekodér je speciální program, který je třeba dále trénovat a nastavovat parametry. Výstupem jsou pak trigramové nebo bigramové modely jazyka určené pro rozpoznávání. Trigramový/bigramový model znamená, že titulky jsou dle spočítané pravděpodobnosti v jazykovém modelu zobrazované a upravované ve trojicích/dvojicích.

Proč je rozpoznávání řeči tak složité?

Slovník 50 000 nejfrekventovanějších slov pokrývá v češtině 90,5 %, v angličtině dokonce 99.3 %.

Slovník 300 000 nejfrekventovanějších slov pokrývá zhruba 97.6 % češtiny. U anglického jazyka je to dokonce 100 %.

Pro pokrytí téměř 100 % českého textu je potřeba slovník 1 500 000 nejfrekventovanějších slov.

Tuto velikost slovníku nutného pro pokrytí českého textu způsobuje obrovské množství ohebných tvarů českých slov. Potencionálně lze od jednoho slovesa odvodit až 300 tvarů, pro podstatné jméno 20 tvarů a pro přídavné jméno 200 tvarů.


Titulky v České televizi

Veřejnoprávní televize má ze zákona povinnost titulkovat 70 % vysílaných pořadů. Nejjednodušší způsob je samozřejmě pořady otitulkovat před odvysíláním. To však jde pouze u pořadů, které nejsou vysílány živě.

Tak také vznikají titulky pro sluchově postižené spoluobčany, tzv. skryté titulky, které lze vyvolat na teletextu ČT.

Vše funguje tak, že si určená osoba poslechne záznam a přepíše veškerou mluvenou řeč do titulků. Ty se pak časově sesynchronizují a nakonec odvysílají s daným pořadem v televizi. Problém nastává u živých pořadů, jako jsou sportovní přenosy, přenosy z tiskových konferencí, z parlamentu a mnohé další. V podstatě jediným řešením by bylo najmout stenografy, kteří by pořady téměř reálně otitulkovali. Problémem je jejich nedostatek a cena jejich práce.

Z těchto důvodů se přistoupilo k vývoji počítačového programu pro tvorbu automatických titulků. Věc však není tak jednoduchá. Rozpoznávání řeči, tak aby bylo alespoň trošku úspěšné, je vázáno na mnoho podpůrných faktorů. V místnosti, kde se řečník nachází, musí být ticho, řečník by měl být v klidu a nejlépe by měl daný text číst. To při sportovních událostech není možné. Zhruba před pěti lety v britské BBC kvůli těmto problémům přistoupili na projekt se stínovým řečníkem. To je člověk, který v klidu přemlouvá původního řečníka. Je to taková obdoba tlumočení z češtiny do češtiny.

Spolupráce s vysokou školou

Na katedře kybernetiky ZČU se zkouší oba přístupy – přímé rozpoznávání a rozpoznávání u stínového řečníka. Úspěšnost automatického titulkování hokejového zápasu je při přímém rozpoznávání 75 % a při přemlouvání stínovým řečníkem přes 90 %. Česká televize rovněž testuje automatické titulkování přenosů z parlamentu, kde úspěšnost je 85 % při přímém rozpoznávání. Rozdíl je dán klidem řečníků, relativním tichem a téměř čteným projevem.

Testovací provoz

Úspěšnost v případě parlamentního záznamu zhruba 85 %. Z tohoto důvodu bude první reálně nasazené automatické titulkování právě na parlamentním záznamu. V České televizi bude probíhat zkušební provoz od jara 2008. Cílem je otestování systému sluchově postiženými.

Katedra kybernetiky chystá i automatické titulkování pro další živé pořady a zkouší nové přístupy. Například hokejové záznamy se budou přemlouvat stínovým řečníkem. Dalším chystaným projektem je automatické titulkování znakovou řečí. Limitujícím faktorem pro všechny tyto úlohy je rozsáhlost českého jazyka a výkonnost počítačů. Jak to v reálu vypadá se můžete podívat na těchto stránkách.

 

Poznámka:

Pod pojmem anotace zvukového záznamu se rozumí přepsání záznamu do textu speciálním programem. Je třeba přesně „říci“ počítači, kde se například komentátor nadechl, kde předal slovo někomu jinému, kde byl velký hluk a podobně. Všechny tyto mimoslovní záznamy se označují speciálními slovy. Například DRUM označuje hluk bubínku v publiku. Zároveň je třeba u cizích slov označit i přesnou výslovnost například New {nů } York{jork}.


Autorka je studentkou katedry kybernetiky Západočeské univerzity.


Autor:
  • Nejčtenější

Jak mohou být tak levná? Výborně hrající sluchátka lze koupit „za hubičku“

v diskusi je 7 příspěvků

3. května 2024

Premium Milovníci kvalitně reprodukované hudby mohou za sluchátka utratit spoustu peněz a nelitovat toho,...

KVÍZ generála Pattona. Vypořádejte se s ocelovou lavinou

v diskusi je 7 příspěvků

28. dubna 2024

Jak jste dobří v tancích, poznáte je nejen na plese, ale i v následujícím kvízu. Kvíz je zaměřen na...

{NADPIS reklamního článku dlouhý přes dva řádky}

{POPISEK reklamního článku, také dlouhý přes dva a možná dokonce až tři řádky, končící na tři tečky...}

Čekání na české lidové auto nemělo konce. Před 100 lety jezdili jen boháči

v diskusi je 27 příspěvků

28. dubna 2024

Před 100 lety Čechoslováci marně čekali na tuzemské lidové auto. Drtivá většina obyvatel si totiž...

Na první pohled to vypadá jako pavouci v ruinách města. Foto je ovšem z Marsu

v diskusi je 5 příspěvků

2. května 2024  15:16

Evropská vesmírná agentura zveřejnila minulý týden nový snímek ze sondy Mars Express, který vyvolal...

{NADPIS reklamního článku dlouhý přes dva řádky}

{POPISEK reklamního článku, také dlouhý přes dva a možná dokonce až tři řádky, končící na tři tečky...}

Necháte se nachytat na triky internetových podvodníků?

v diskusi je 18 příspěvků

29. dubna 2024

Typickou obětí internetového podvodu už nejsou jen senioři. Kyberzločinci se zaměřili i na mladší...

Malý bojovník na Měsíci zvládl, co se nečekalo. Přežil tamní kruté noci

v diskusi jsou 2 příspěvky

3. května 2024  14:32

Japonské zařízení Smart Lander for Investigating Moon (SLIM) bylo prvním, které letos úspěšně...

Čína letí jako první země světa odebrat vzorky z odvrácené strany Měsíce

v diskusi je 20 příspěvků

3. května 2024  8:27,  aktualizováno  11:28

V pátek krátce před půl dvanáctou dopoledne našeho času se do vesmírného prostoru vydala čínská...

Facebooku se AI vyplatí až za roky a Microsoft do ní šel kvůli Googlu

v diskusi je 1 příspěvek

3. května 2024

Kdo nemá generativní umělou inteligenci, jako by nebyl. Alespoň to tak vypadá u největších...

Jak mohou být tak levná? Výborně hrající sluchátka lze koupit „za hubičku“

v diskusi je 7 příspěvků

3. května 2024

Premium Milovníci kvalitně reprodukované hudby mohou za sluchátka utratit spoustu peněz a nelitovat toho,...

10 nejčastějších podvodů na internetu: Dokážete ochránit sebe i svou rodinu?
10 nejčastějších podvodů na internetu: Dokážete ochránit sebe i svou rodinu?

V digitální éře, kde technologie proniká do všech aspektů našich životů, se také zvyšuje riziko podvodů. Od falešných e-mailů a inzerátů až po...

Dara Rolins je po další plastice. Kritiku fanoušků nechápe, cítí se svěží

Zpěvačka Dara Rolins (51) se na čas stáhla z veřejného života. V tom období prodělala „estetický zákrok“ a na sociální...

Natáčení Přátel bylo otřesné, vzpomíná herečka Olivia Williamsová

Britská herečka Olivia Williamsová (53) si ve čtvrté sérii sitcomu Přátelé zahrála epizodní roli jedné z družiček na...

Byli vedle ní samí ztroskotanci, vzpomíná Basiková na muže Bartošové

Byly každá z jiného těsta, ale hlavně se pohybovaly na opačných pólech hudebního spektra. Iveta Bartošová byla...

Autofotka: Sen z plakátů v kotrmelcích. Mladíček v tunelu rozbil Ferrari F40

Symbol italské nenažranosti se již skoro čtyři dekády pokouší zabít své řidiče. Jízda s Ferrari F40 bez posilovače...

Ukaž kozy, řvali na ni. Potřebovala jsem se obouchat, vzpomíná komička Macháčková

Rozstřel Pravidelně vystupuje v pořadu Comedy Club se svými stand-upy, za knihu Svatební historky aneb jak jsem se nevdala se...