Klávesové zkratky na tomto webu - základní­
Přeskočit hlavičku portálu


Jak vám Google vnucuje videa? Nahlédněte pod pokličku YouTube

aktualizováno  9:21
Při brouzdání po YouTube vás zřejmě napadlo, na základě čeho vám doporučuje videa. Ponořte se s námi do fungování algoritmu, který vyvíjí programátorská elita Googlu. Na problém manipulace se poté podíváme s jeho bývalým vývojářem, určování trendů objasní youtuber Tary a nakonec prozradíme, jak doporučení ovlivnit.

Pojďme se mrknout pod pokličku Youtubu, jak největší streamovací služba funguje. | foto: Fotomontáž Pavel Kasík

Možná se vám to také stalo. Večerní nuda a než si to uvědomíte, už se přes pravý panel návrhů proklikáváte YouTubem. Klik za klikem a najednou vůbec netušíte, proč koukáte na pouliční bitku, když jste začali u návodu na avokádovou pomazánku. Mnohdy pak v komentářích vedou věty „I´m on the weird part of YouTube again“ (v překladu: Jsem znovu na té divné stránce YouTubu). Jak se na ni dostaneme?

Rolls-Royce mezi programy

Zavede nás tam chytrý algoritmus. Vývojáři uvnitř firmy ho označují za „nejsofistikovanější doporučovací systém současnosti“. A proč jsou na něj tak pyšní? Systém doporučování využívá mnoho stránek a služeb, ovšem YouTube se musí vypořádat se třemi faktory:

  • Objem: Na YouTube najdete miliardy aktivních videí. Algoritmus tedy musí pracovat s ohromným množstvím dat. Na astronomická čísla se můžete podívat zde.

  • Aktuálnost: Každou minutu uživatelé nahrají 400 hodin videa. I ty musí software zpracovat a vyhodnotit jejich relevanci pro každého individuálního člověka.

  • Šum: V prodejně elektroniky jsou návrhy jednoduché. Když někdo brouzdá notebooky, doporučíte mu pod produktem jiný notebook nebo příslušenství. Ale uživatelské chování na YouTube je jen extrémně těžko předvídatelné. Někdy máte chuť si pustit energickou hudbu, jindy se zasmát u youtubera, večer si pustit tutoriál na zavázání kravaty a v noci teskné soundtracky. Úkolem algoritmu je najít ve vašem chování některé vzorce a na základě nich pak doporučovat.

Algoritmus v současnosti vyvíjí tým Google Brain - nejlepší mozky z Alphabetu zabývající se umělou inteligencí (AI). Algoritmus si samozřejmě YouTube střeží, ovšem jeho fungování zveřejnil (PDF, anglicky). Pokud se nechcete prokousávat složitější angličtinou, zkusíme si to zjednodušit.

Vysvětlení jednodušeFiltr přes dvě síta

Aby se AI prokousala množstvím videí a vybrala tucet vám šitých na míru, používá dvě síta. Tím prvním je generování kandidátů (candidate generation). To zúží díky vaší historii a kontextu (demografických údajů, lokace, slov ve vyhledávání) výběr řádově ze stamilionů na stovky.

Tento zlomek projde druhým sítem nazvaným hodnocení (ranking), které přidělí díky testování v reálném čase každému videu skóre - a jen ty nejvyšší si zaslouží místo na vaší hlavní stránce nebo pravém panelu návrhů.

Schéma sít

Do roku 2012 se autoři odměňovali za počet zhlédnutí - tedy kliknutí na video. Vznikala tak clickbaitová videa, u kterých ovšem uživatelé nevydrželi. Alphabet proto v roce 2012 vytvořil nové ústřední pravidlo. Nejdůležitější je délka sledování videa a uživatelé, kteří je chodí sledovat pravidelně, ostatní je podružné.

Je proto pravděpodobné, že se vám budou objevovat videa, která jste již viděli. Pokud u nich strávíte delší dobu a kliknete na ně dle nálady tu a tam znovu, YouTube nemá důvod vám ho opět nedoporučit, dokud vás neomrzí. Typickým příkladem jsou dlouhé mixy hudby nebo hodiny záznamu bouřky, které si lidé pouští jako podcast a doposlouchají celé.

Vysvětlení složitějiNeuronová síť nám studuje podvědomí

A teď se ponořme více do hloubky. Předchůdcem současného softwaru byla tzv. maticová faktorizace. Složitě znějící sousloví značí metodu doporučování na základě předchozí činnosti, v níž hledá skryté vzorce. Ty pak zpřesňují preference daného uživatele a lépe vyfiltrují výsledky. Výhodou maticové faktorizace je adaptace na změny, tedy v našem případě nával nových videí nebo měnící se zájem uživatele.

Podle vývojářů Googlu je tato metoda zbytečně složitá. Vyvinuli proto neuronovou síť, která z faktorizace vychází a zjednodušuje ji. Algoritmus se opírá primárně o naši historii spolu se zmíněnými skrytými náznaky, které jdou podle vývojářů do hloubky více než řízená zpětná vazba (líbí/nelíbí se mi, dotazníky). Můžeme si to představit tak, že metoda spíše než z vědomí čerpá z našeho podvědomí.

Vyhledávání hraje roli

Schéma zúžení výběru

Schéma zúžení výběru

Pro software je stejně důležitá historie sledování jako hledání. Cokoli, co zadáte do vyhledávače, se zaindexuje a promítne do následných návrhů. Nehledě na to, jestli jste na nalezená videa klikli. Do souhrnu dat se přidají demografické údaje - věk, pohlaví i stát, to vše má o vás Google k dispozici. Vývojáři si uvědomují, že uživatelé preferují nová videa, a proto i datum publikace se řadí mezi klíčové faktory.

Prvním sítem projde jen pár stovek videí. Díky zúženému vzorku se může v druhém sítu zapojit faktorů mnohem více. Některé z nich jsou binární, tedy mají pouze dva možné výsledky (např. je-li uživatel přihlášen). Většina má miliony různých variant (např. poslední hledaný výraz) a kategorií jsou stovky. Software je musí rychle zpracovat, ovšem vývojáři přiznávají, že neuronová síť v reálném čase všechny faktory nestíhá a pracuje s tím, co aktuálně má.

Učte děti programovat, radí expertka z Googlu. Umělá inteligence je překvapivě stará

Kromě toho se do hry zapojují nejen atributy uživatele, ale i samotného videa. Je přehráváno více v Brazílii? Proklikli se na něj lidé z tohoto videa? Podobně si software zjišťuje váš zájem o kanály. Sledujete jeho videa pravidelně? Proč u nich nevydržíte do konce? Proč jste přestali kanál odebírat?

Ze získaných dat pak algoritmus vygeneruje pro video nominální skóre, které se odvíjí od předpokladu dvou věcí - zda na něj kliknete a jak dlouho na něm strávíte. Štve vás nějaké video, které se vám neustále zobrazuje? Je to tím, že má vysoké skóre. Snížit ho můžete tak, že ho budete ignorovat, dokud nezmizí, nebo na něj kliknete a po vteřině utečete pryč. Přesně to totiž software nemá rád.

Trendy„Pozitivní diskriminace“ v praxi

Na hlavní stránce se setkáte i s tzv. trendy. Jde o panel videí, která jsou aktuálně populární. Ale popularita není vše. „Některé trendy jsou předvídatelné, jako nová píseň od známého interpreta, jiné jsou ovšem zcela překvapivé. Proto se snažíme o kombinaci popularity a novinek,“ píší vývojáři.

Pořadí trendů (#1, #2...) se určuje zejména podle rychlosti růstu zhlédnutí, místa vzniku a dalších faktorů. Proto video s největším počtem zhlédnutí nemusí být nutně na prvním místě. Že počty zhlédnutí nehrají hlavní roli potvrzuje i známý český youtuber Tary.

YouTube zkouší nahradit pozadí i bez zeleného plátna

„Ještě před rokem se do trendů dostalo téměř vše, co mělo abnormální počet lajků a komentářů. A díky tomu jsem získal 400 tisíc odběratelů za rok. Fungovalo to tak, že jsem řekl: Pojďme hecnout 50 tisíc lajků. Uživatelé to zvládli, Youtube poznal, že to je trendy a hodil to tam. A to samé platilo u komentářů,“ popisuje úspěšný youtuber.

Od prosince loňského roku se ovšem systém výběru proměnil. „V trendech se nově objevují i videa s málo zhlédnutími i lajky. Je to díky kategorii, kam spadají. YouTube zřejmě vymezil určité kvóty z jednotlivých kategorií,“ říká Tary. Například vlog z jízdy na motorce může být méně úspěšný než hudební novinky, ale díky kategorii auto-moto se do trendů zařadí.

ManipulaceOvlivňuje umělá inteligence běh společnosti?

V poslední době se řeší vliv fake news na výsledky voleb. Otázkou je, jestli nás více neovlivňuje něco „z vlastních řad“. O hrozbě YouTube na mínění populace promluvil pro The Guardian jeden z těch, kdo vidí pod pokličku - vývojář algoritmu návrhů.

„YouTube se tváří jako realita, ale je pokřivená, abychom na něm trávili více času,“ říká francouzský programátor Guillaume Chaslot. Google ho propustil v roce 2013. Oficiální důvod: výkonnostní problémy. Chaslotova verze: snažil se prosadit změnu, aby byl algoritmus „víc fér“.

Rusko zkouší ovlivnit dění všude po světě. Jinak, než si většina myslí

Představy o ruských hackerech jsou často zjednodušené (ilustrační snímek)

Po padáku se začal do hloubky věnovat strojovému učení, na kterém se spolupodílel. A během amerických prezidentských voleb si všiml menší anomálie. „Bylo to zvláštní. Nezávisle na tom, jestli jste začali hledat Trumpa nebo Clintonovou, návrhy videí vás tlačily do protrumpovské oblasti,“ říká Chaslot.

Autor článku v The Guardian Paul Lewis se rozhodl jeho teorii prověřit. Prošel tisícovku nejúspěšnějších videí spojených s volbami a došel k šokujícímu skóre: 551:92 (360 neutrálních). YouTube šestkrát častěji doporučoval videa, která pomáhala Trumpovi než Clintonové. Algoritmus tak jistě nebyl přednastaven, ale díky uživatelskému jednání se tak začal chovat. Jednoduše řečeno: lidem se více líbila videa o Trumpovi, tak je YouTube začal doporučovat.

Chaslot spustil vlastní stránku algotransparency.org, kde vysvětluje, jak dle něj YouTube propaguje konspirační teorie nebo upřednostňuje některé volební kandidáty.

Z pohledu uživateleJak mohu doporučení ovlivnit?

No a jak můžete přímo vy zasáhnout do nabízení videí? Jako uživatelé máte vícero možností. Jedním z nich je přihlášení: „Když začnete sledovat videa přihlášení, budete dostávat více personalizované návrhy,“ vysvětluje pro Technet Alžběta Houzarová z Googlu.

„Pokud nejste s doporučeními spokojeni, videa, kanály a sekce, které vás nezajímají, můžete odstranit a svá doporučení tak vylepšit.“ To můžete udělat pomocí funkce Nezajímá mě.

Nezajímá mě

„Pokud z jednoho kanálu odstraníte dvě nebo více videí, tento kanál už vám nebude doporučován,“ pokračuje Houzarová. „V případě, že jste omylem odstranili doporučení, která chcete zachovat, můžete jej klepnutím na tlačítko Zpět vrátit. To je v tuto chvíli možné pouze na počítači.“

Je také možné, že jste odstranili kanály, které vás nezajímaly, a nyní již ano. To napravíte na stránce history.google.com, kde kliknete na otevřenou nabídku a poté na „Zpětná vazba Nezajímavé“. Doporučení obnovíte kliknutím na „Smazat zpětnou vazbu“. A doporučení můžete ovlivnit i v historii vyhledávání.

„Řekněme, že jste hledali určité téma, například výměnu řetězu kola. Ale teď je to ve vašich doporučeních samé video s koly. Stačí přejít do historie sledování a vyhledávání a vymazat tato konkrétní videa a výrazy,“ doplňuje Houzarová s varováním, že vymazání nelze vrátit zpět.

Příště se podíváme pod pokličku jiné softwarové zbraně YouTubu - programu Content ID, který bdí nad autorskými právy a blokuje videa, která dle něj kopírují obsah.



Kdo ovlivňuje podobu vaší hlavní stránky Facebooku a jak na něj vyzrát

Jak vám facebook sestavuje obsah hlavní stránky na míru?

Zajímalo vás někdy, proč na Facebooku vídáte příspěvky v pořadí, v jakém jsou? Odpovědí je News...

YouTube jako továrna na peníze. Jak na tomto portálu funguje reklama?

YouTube jako továrna na peníze

Vše se točí kolem peněz a na YouTube to není jinak. Jenže když se do reklamního kolotoče zamotají...

Video bylo zablokováno. Jak Youtube zvládá kontrolovat miliardy videí

Content ID

Běžní uživatelé o programu Content ID mnohdy neslyšeli. Autoři mu fandí, protože díky němu získali...

Jak vám Google vnucuje videa? Nahlédněte pod pokličku YouTube

Youtube pod pokličkou

Při brouzdání po YouTube vás zřejmě napadlo, na základě čeho vám doporučuje videa. Ponořte se s...

Nejčtenější

Nové iPhony Xs budou stát až 43 500 korun. Do Česka dorazí 29. září

Matura Jan: Online #7043

Apple na akci Apple Keynote 2018 představil tři nové iPhony. Nástupce modelu X se jmenuje Xs, zvětšená varianta pak Xs...

Ve dveřích se ohlédl a usmál. Na co nezapomene česká prokurátorka v Haagu

Anna Richterová v době, kdy pracovala pro tribunál v Den Haagu. Snímek je z...

Prokurátorka Anna Richterová je jedinou Češkou, která pracovala u mezinárodního tribunálu pro vyšetřování zločinů v...



Kennedyho sestru Rosemary zničili ambiciozní rodiče lobotomií

Kennedyho sestru zničili ambiciozní rodiče lobotomií

13. září 1918 se narodila Rosemary Kennedyová, sestra prezidenta Johna Fitzgeralda Kennedyho. Od dětství s ní byly...

Obří Ruslan přistál v Praze. Sledovali jste v přímém přenosu na Slow TV

Antonov AN-124 100 Ruslan přistává v 11.9. v Praze.

Z Pardubic do Prahy má přiletět jedno z největších letadel světa Antonov An-124 100 zvaný Ruslan. Stroj krátce po šesté...

Díru do ISS mohli navrtat Američané, tvrdila ruská média

Mezinárodní kosmická stanice ISS.

Američtí astronauti jsou podle ruské agentury Roskosmos nejpravděpodobnějšími viníky incidentu na ISS, při němž na...

Další z rubriky

Asistent Google si poradí se dvěma jazyky najednou. Čeština pořád chybí

Umělá inteligence Google Assistant se už nyní připravuje na konverzaci v...

Už delší dobu se mluvilo o funkci bilingvního asistenta. Koncem léta Google tuto funkci konečně představil spolu s...

10 let na trhu: nová verze Chrome přináší správu hesel a nový design

Nově uvedená verze Google Chrome nabídla poprvé po deseti letech zásadně...

Po deseti letech dostal Google Chrome nový (zakulacený) vzhled a několik dalších funkcí, které bylo dosud potřeba řešit...

Apple usnadní policii získat uživatelská data. Zřídí speciální portál

Zákazníci vstupují do prodejny Apple, New York (30. 7. 2018).

Ve Spojených státech pokračují diskuze o tom, jaká data schraňují firmy o uživatelích a jak je může policie získat....

Akční letáky
Akční letáky

Všechny akční letáky na jednom místě!

Najdete na iDNES.cz