Možná se vám to také stalo. Večerní nuda a než si to uvědomíte, už se přes pravý panel návrhů proklikáváte YouTubem. Klik za klikem a najednou vůbec netušíte, proč koukáte na pouliční bitku, když jste začali u návodu na avokádovou pomazánku. Mnohdy pak v komentářích vedou věty „I´m on the weird part of YouTube again“ (v překladu: Jsem znovu na té divné stránce YouTubu). Jak se na ni dostaneme?

Rolls-Royce mezi programy

Zavede nás tam chytrý algoritmus. Vývojáři uvnitř firmy ho označují za „nejsofistikovanější doporučovací systém současnosti“. A proč jsou na něj tak pyšní? Systém doporučování využívá mnoho stránek a služeb, ovšem YouTube se musí vypořádat se třemi faktory:

Objem : Na YouTube najdete miliardy aktivních videí. Algoritmus tedy musí pracovat s ohromným množstvím dat. Na astronomická čísla se můžete podívat zde .





: Na YouTube najdete miliardy aktivních videí. Algoritmus tedy musí pracovat s ohromným množstvím dat. Na astronomická čísla se můžete podívat . Aktuálnost : Každou minutu uživatelé nahrají 400 hodin videa. I ty musí software zpracovat a vyhodnotit jejich relevanci pro každého individuálního člověka.





: Každou minutu uživatelé nahrají 400 hodin videa. I ty musí software zpracovat a vyhodnotit jejich relevanci pro každého individuálního člověka. Šum: V prodejně elektroniky jsou návrhy jednoduché. Když někdo brouzdá notebooky, doporučíte mu pod produktem jiný notebook nebo příslušenství. Ale uživatelské chování na YouTube je jen extrémně těžko předvídatelné. Někdy máte chuť si pustit energickou hudbu, jindy se zasmát u youtubera, večer si pustit tutoriál na zavázání kravaty a v noci teskné soundtracky. Úkolem algoritmu je najít ve vašem chování některé vzorce a na základě nich pak doporučovat.



Algoritmus v současnosti vyvíjí tým Google Brain - nejlepší mozky z Alphabetu zabývající se umělou inteligencí (AI). Algoritmus si samozřejmě YouTube střeží, ovšem jeho fungování zveřejnil (PDF, anglicky). Pokud se nechcete prokousávat složitější angličtinou, zkusíme si to zjednodušit.

Vysvětlení jednoduše Filtr přes dvě síta

Aby se AI prokousala množstvím videí a vybrala tucet vám šitých na míru, používá dvě síta. Tím prvním je generování kandidátů (candidate generation). To zúží díky vaší historii a kontextu (demografických údajů, lokace, slov ve vyhledávání) výběr řádově ze stamilionů na stovky.

Tento zlomek projde druhým sítem nazvaným hodnocení (ranking), které přidělí díky testování v reálném čase každému videu skóre - a jen ty nejvyšší si zaslouží místo na vaší hlavní stránce nebo pravém panelu návrhů.

Do roku 2012 se autoři odměňovali za počet zhlédnutí - tedy kliknutí na video. Vznikala tak clickbaitová videa, u kterých ovšem uživatelé nevydrželi. Alphabet proto v roce 2012 vytvořil nové ústřední pravidlo. Nejdůležitější je délka sledování videa a uživatelé, kteří je chodí sledovat pravidelně, ostatní je podružné.

Je proto pravděpodobné, že se vám budou objevovat videa, která jste již viděli. Pokud u nich strávíte delší dobu a kliknete na ně dle nálady tu a tam znovu, YouTube nemá důvod vám ho opět nedoporučit, dokud vás neomrzí. Typickým příkladem jsou dlouhé mixy hudby nebo hodiny záznamu bouřky, které si lidé pouští jako podcast a doposlouchají celé.



Vysvětlení složitěji Neuronová síť nám studuje podvědomí

A teď se ponořme více do hloubky. Předchůdcem současného softwaru byla tzv. maticová faktorizace. Složitě znějící sousloví značí metodu doporučování na základě předchozí činnosti, v níž hledá skryté vzorce. Ty pak zpřesňují preference daného uživatele a lépe vyfiltrují výsledky. Výhodou maticové faktorizace je adaptace na změny, tedy v našem případě nával nových videí nebo měnící se zájem uživatele.

Podle vývojářů Googlu je tato metoda zbytečně složitá. Vyvinuli proto neuronovou síť, která z faktorizace vychází a zjednodušuje ji. Algoritmus se opírá primárně o naši historii spolu se zmíněnými skrytými náznaky, které jdou podle vývojářů do hloubky více než řízená zpětná vazba (líbí/nelíbí se mi, dotazníky). Můžeme si to představit tak, že metoda spíše než z vědomí čerpá z našeho podvědomí.

Vyhledávání hraje roli

Schéma zúžení výběru

Pro software je stejně důležitá historie sledování jako hledání. Cokoli, co zadáte do vyhledávače, se zaindexuje a promítne do následných návrhů. Nehledě na to, jestli jste na nalezená videa klikli. Do souhrnu dat se přidají demografické údaje - věk, pohlaví i stát, to vše má o vás Google k dispozici. Vývojáři si uvědomují, že uživatelé preferují nová videa, a proto i datum publikace se řadí mezi klíčové faktory.

Prvním sítem projde jen pár stovek videí. Díky zúženému vzorku se může v druhém sítu zapojit faktorů mnohem více. Některé z nich jsou binární, tedy mají pouze dva možné výsledky (např. je-li uživatel přihlášen). Většina má miliony různých variant (např. poslední hledaný výraz) a kategorií jsou stovky. Software je musí rychle zpracovat, ovšem vývojáři přiznávají, že neuronová síť v reálném čase všechny faktory nestíhá a pracuje s tím, co aktuálně má.

Kromě toho se do hry zapojují nejen atributy uživatele, ale i samotného videa. Je přehráváno více v Brazílii? Proklikli se na něj lidé z tohoto videa? Podobně si software zjišťuje váš zájem o kanály. Sledujete jeho videa pravidelně? Proč u nich nevydržíte do konce? Proč jste přestali kanál odebírat?

Ze získaných dat pak algoritmus vygeneruje pro video nominální skóre, které se odvíjí od předpokladu dvou věcí - zda na něj kliknete a jak dlouho na něm strávíte. Štve vás nějaké video, které se vám neustále zobrazuje? Je to tím, že má vysoké skóre. Snížit ho můžete tak, že ho budete ignorovat, dokud nezmizí, nebo na něj kliknete a po vteřině utečete pryč. Přesně to totiž software nemá rád.

Trendy „Pozitivní diskriminace“ v praxi

Na hlavní stránce se setkáte i s tzv. trendy. Jde o panel videí, která jsou aktuálně populární. Ale popularita není vše. „Některé trendy jsou předvídatelné, jako nová píseň od známého interpreta, jiné jsou ovšem zcela překvapivé. Proto se snažíme o kombinaci popularity a novinek,“ píší vývojáři.

Pořadí trendů (#1, #2...) se určuje zejména podle rychlosti růstu zhlédnutí, místa vzniku a dalších faktorů. Proto video s největším počtem zhlédnutí nemusí být nutně na prvním místě. Že počty zhlédnutí nehrají hlavní roli potvrzuje i známý český youtuber Tary.

„Ještě před rokem se do trendů dostalo téměř vše, co mělo abnormální počet lajků a komentářů. A díky tomu jsem získal 400 tisíc odběratelů za rok. Fungovalo to tak, že jsem řekl: Pojďme hecnout 50 tisíc lajků. Uživatelé to zvládli, Youtube poznal, že to je trendy a hodil to tam. A to samé platilo u komentářů,“ popisuje úspěšný youtuber.



Od prosince loňského roku se ovšem systém výběru proměnil. „V trendech se nově objevují i videa s málo zhlédnutími i lajky. Je to díky kategorii, kam spadají. YouTube zřejmě vymezil určité kvóty z jednotlivých kategorií,“ říká Tary. Například vlog z jízdy na motorce může být méně úspěšný než hudební novinky, ale díky kategorii auto-moto se do trendů zařadí.

Manipulace Ovlivňuje umělá inteligence běh společnosti?

V poslední době se řeší vliv fake news na výsledky voleb. Otázkou je, jestli nás více neovlivňuje něco „z vlastních řad“. O hrozbě YouTube na mínění populace promluvil pro The Guardian jeden z těch, kdo vidí pod pokličku - vývojář algoritmu návrhů.

„YouTube se tváří jako realita, ale je pokřivená, abychom na něm trávili více času,“ říká francouzský programátor Guillaume Chaslot. Google ho propustil v roce 2013. Oficiální důvod: výkonnostní problémy. Chaslotova verze: snažil se prosadit změnu, aby byl algoritmus „víc fér“.

Po padáku se začal do hloubky věnovat strojovému učení, na kterém se spolupodílel. A během amerických prezidentských voleb si všiml menší anomálie. „Bylo to zvláštní. Nezávisle na tom, jestli jste začali hledat Trumpa nebo Clintonovou, návrhy videí vás tlačily do protrumpovské oblasti,“ říká Chaslot.

Autor článku v The Guardian Paul Lewis se rozhodl jeho teorii prověřit. Prošel tisícovku nejúspěšnějších videí spojených s volbami a došel k šokujícímu skóre: 551:92 (360 neutrálních). YouTube šestkrát častěji doporučoval videa, která pomáhala Trumpovi než Clintonové. Algoritmus tak jistě nebyl přednastaven, ale díky uživatelskému jednání se tak začal chovat. Jednoduše řečeno: lidem se více líbila videa o Trumpovi, tak je YouTube začal doporučovat.

Chaslot spustil vlastní stránku algotransparency.org, kde vysvětluje, jak dle něj YouTube propaguje konspirační teorie nebo upřednostňuje některé volební kandidáty.

Z pohledu uživatele Jak mohu doporučení ovlivnit?

No a jak můžete přímo vy zasáhnout do nabízení videí? Jako uživatelé máte vícero možností. Jedním z nich je přihlášení: „Když začnete sledovat videa přihlášení, budete dostávat více personalizované návrhy,“ vysvětluje pro Technet Alžběta Houzarová z Googlu.

„Pokud nejste s doporučeními spokojeni, videa, kanály a sekce, které vás nezajímají, můžete odstranit a svá doporučení tak vylepšit.“ To můžete udělat pomocí funkce Nezajímá mě.

„Pokud z jednoho kanálu odstraníte dvě nebo více videí, tento kanál už vám nebude doporučován,“ pokračuje Houzarová. „V případě, že jste omylem odstranili doporučení, která chcete zachovat, můžete jej klepnutím na tlačítko Zpět vrátit. To je v tuto chvíli možné pouze na počítači.“



Je také možné, že jste odstranili kanály, které vás nezajímaly, a nyní již ano. To napravíte na stránce history.google.com, kde kliknete na otevřenou nabídku a poté na „Zpětná vazba Nezajímavé“. Doporučení obnovíte kliknutím na „Smazat zpětnou vazbu“. A doporučení můžete ovlivnit i v historii vyhledávání.

„Řekněme, že jste hledali určité téma, například výměnu řetězu kola. Ale teď je to ve vašich doporučeních samé video s koly. Stačí přejít do historie sledování a vyhledávání a vymazat tato konkrétní videa a výrazy,“ doplňuje Houzarová s varováním, že vymazání nelze vrátit zpět.

Příště se podíváme pod pokličku jiné softwarové zbraně YouTubu - programu Content ID, který bdí nad autorskými právy a blokuje videa, která dle něj kopírují obsah.