Součástí grafických karet „RTX“ společnosti Nvidia jsou i takzvaná tensorová jádra, která jsou určena pro provoz systémů umělé inteligence, včetně strojového učení typu Deep Learning a provoz neuronových sítí. Mimo vylepšování renderovaného obrazu ve hrách pomocí DLSS (a několika dalších poměrně specifických úloh) se ale tato jádra zatím moc nevyužívají a většinu času spí.
Nvidia nyní představila bezplatnou aplikaci RTX Voice pro čištění hlasu od okolního hluku, která právě tato jádra využívá. Systém tak dokáže rozpoznat, co hlasem je, co hlasem není, a velmi přesně tak odstranit vše, co není hlas a zároveň hlas samotný bez zkreslení ponechat. To je teorie, která je však i v současné betaverzi RTX Voice velmi blízko skutečnosti.
Musíte mít RTX kartu
Podmínkou použití je přítomnost grafické karty RTX v počítači, instalované ovladače 410.18 a operační systém Windows 10. My jsme systém vyzkoušeli s kartou Nvidia Quadro RTX4000 v počítači Acer Concept D500, na kterém stále běží i systém Folding@Home týmu TechnetCZ.
Po instalaci RTX Voice – stáhnout jej můžete z webu Nvidie – můžete spustit stejnojmennou utilitu, ve které nastavíte jeho fungování. Pokud chcete čistý zvuk vysílat, ať už do videokonference nebo třeba při streamování na Twitch, pak vyberete jako „input device“ svůj mikrofon. Pokud naopak chcete čistit zvuk, který vám přichází do sluchátek, pak použijete nastavení „output device“, kde nastavíte zvukový výstup skrze který posloucháte.
Při použití komunikačního softwaru nebo třeba streamovací aplikace je nutné v nich nastavit správný vstup – mimo dosavadního zvolíte ten označený jako Nvidia RTX Voice.
A to je skoro vše. Označením políčka „remove background noise“ se funkce čištění zapne, pomocí posuvníku pak jemněji nastavíte její intenzitu.
Ve videu si můžete pustit ukázku toho, jak RTX Voice dokáže odseparovat lidský hlas od pozadí šumění lesa, hmyzu a zpěvu ptáků z vysílání projektu SlowRadio, ve druhé části pak od ruchů ulice s deštěm a dopravou.
Hlas v tichu
Zatímco v prvním případě se to daří znamenitě, ve druhém je někdy více zasažen i samotný hlas. Je ale znát, že se systém v prvních sekundách více učí na konkrétní situaci, a tak se zvuk dost rychle lepší. Ve většině situací a správném nastavení je však výsledek překvapivě dobrý, a to se jedná o betaverzi.
Systému se příliš nedaří odseparovat hlas od hudby hrající na pozadí, protože některé nástroje, a zejména pak zpěvák, systém pochopitelně mate. Ale zatímco hudbu ve svém okolí snadno ztlumíte, u ostatního hluku to jde mnohem hůře, a tam to RTX Voice zvládá velmi dobře.