Napodobování cizích hlasů pomocí umělé inteligence (ilustrační foto) | foto: montáž: Pavel Kasík - Technet.cz, Profimedia.cz

Stačí jedna minuta a mají váš hlas. Program pak dokáže mluvit jako vy

  • 51
Společnost Lyrebird má nový program, kterému stačí minuta nahrávky něčí mluvy, aby ji dokázal napodobit. Využívá k tomu strojové učení.

Služba Lyrebird odkáže z jednominutové nahrávky vytvořit „získat hlas“ mluvčího.

Jmenuje se Lyrebird a může změnit některé jistoty, které na tomto světě máme. Nový algoritmus vyvinutý v laboratoři MILA lab na kanadské University of Montréal totiž může přinést trochu legrace, ale hodně problémů. Podle slov jeho tvůrců mu stačí jen jedna minuta záznamu hlasu k tomu, aby jej dokázal imitovat. Autoři hodlají svůj nápad dodávat jako vývojářské knihovny (API) dalším vývojářům, kteří tak budou moci funkci napodobování hlasu vložit do nejrůznějších aplikací..

Jak z popisu systému vyplývá, není třeba, aby si systém nahrál konkrétní slova či věty, které má služba Lyreird reprodukovat. Z jednoho minutového záznamu má získat dostatečná data k tomu, aby dokázal například syntetizovat hlas vašeho známého nebo třeba prezidenta USA, případně diskuzi prezidentů.

Následující ukázka je počítačem generovaná:

Progran Lyrebird (pojmenovaný podle australského opeřence známého schopností napodobovat zvuky ze svého okolí) využívá strojového učení, konkrétně tzv. „hluboké neuronové sítě“, které se učí na vzorcích a poté sestavují nové obsahy, v tomto případě audio (více o neuronových sítích).

Lyrebird si poradí i s různými intonacemi. Stejnou větu tak nikdy nepronese úplně stejně, vždy zní trošičku jinak. Výsledný program by měl navíc umožňovat manuálně nastavit různé parametry týkající se dikce, intonace, emocí atd., což může ještě dále zvýšit důvěryhodnost imitované nahrávky.

Ukázka stejné věty pronášené opakovaně imitovanými mluvčími:

K čemu to jde použít, nebo rovnou zneužit?

Každý si asi dokáže představit, jaké škody může podobná aplikace napáchat. Ať již jde o soudní jednání, lákání peněz i z jinak obezřetných uživatelů, obcházení hlasem aktivovaných zabezpečovacích systémů nebo prostě jen dehonestace nějaké osoby.

Výrazně lépe se tak budou podvrhávat zvukové nahrávky, které nyní museli manipulátoři slepovat se zachycených útržků vět a slov oběti, případně využít služeb schopného imitátora.

Tvůrci sice mají na své stránce prohlášení o etice, ale to se spíše vysmívá všem kritikům. „Naše technologie vyvolává důležité společenské otázky. Zvukové nahrávky jsou nyní považovány za silný důkaz. Mohlo by tedy dojít ke zneužití naší technologie například k manipulaci, dehonestaci a dalším problémům souvisejícím s krádeží hlasu někoho jiného. Tím, že naši technologii představíme veřejně, chceme předejít rizikům. Doufáme, že si všichni brzy uvědomí, že taková technologie existuje a že je možné kopírovat hlas někoho jiného. Obecněji bychom chtěli upozornit na problematiku důkazů, jakými by v blízké budoucnosti mohly být zvukové nahrávky,“ píše firma.

Není první, ale je nejrychlejší

Na podobné novinky si ale zřejmě opravdu musíme zvykat. Firma není jediná, kdo podobný systém vyvíjí. Zatím sice nejde

Podobnou funkci slibuje systém VoCo, na kterém pracuje Adobe. Ten k analýze potřebuje asi dvacet minut nahrávky mluvčího. Když zástupce Adobe systém na jedné konferenci prezentoval, namluvil větu a začal si s ní různě hrát. Přehazoval slova, přes klávesnici přidal další a vždy nechal systém, aby novou větu přečetl. A opravdu se zdálo, že i nová slova jsou pronášena hlasem prezentujícího.

Archiv: firma Adobe představila koncept nástroje pro napodobování hlasů:

O podobný systém se jistě pokoušejí i další firmy. Pojem postfaktická doba tak možná brzy dostane ještě zlověstnější nádech.

Na Stanfordově univerzitě v Kalifornii zase vývojáři pracují na mapování pohybů z obličeje na obličej v reálném čase. V roce 2016 představili ukázku nástroje, který umí generovat fotorealistická videa obličejů na základě zdrojových dat zachycených například obyčejnou webkamerou.

Projekt Face2Face umí vytvářet videa cizích obličejů v reálném čase:

Aktualizace: Doplnili jsme zvukové ukázky, vyjádření firmy a popis programu. Změnili jsme ilustrační fotografii článku. Doplnili jsme informace o projektu Face2Face.

,