Klávesové zkratky na tomto webu - základní­
Přeskočit hlavičku portálu


Jak vám Google vnucuje videa? Nahlédněte pod pokličku YouTube

aktualizováno  9:21
Při brouzdání po YouTube vás zřejmě napadlo, na základě čeho vám doporučuje videa. Ponořte se s námi do fungování algoritmu, který vyvíjí programátorská elita Googlu. Na problém manipulace se poté podíváme s jeho bývalým vývojářem, určování trendů objasní youtuber Tary a nakonec prozradíme, jak doporučení ovlivnit.

Pojďme se mrknout pod pokličku Youtubu, jak největší streamovací služba funguje. | foto: Fotomontáž Pavel Kasík

Možná se vám to také stalo. Večerní nuda a než si to uvědomíte, už se přes pravý panel návrhů proklikáváte YouTubem. Klik za klikem a najednou vůbec netušíte, proč koukáte na pouliční bitku, když jste začali u návodu na avokádovou pomazánku. Mnohdy pak v komentářích vedou věty „I´m on the weird part of YouTube again“ (v překladu: Jsem znovu na té divné stránce YouTubu). Jak se na ni dostaneme?

Rolls-Royce mezi programy

Zavede nás tam chytrý algoritmus. Vývojáři uvnitř firmy ho označují za „nejsofistikovanější doporučovací systém současnosti“. A proč jsou na něj tak pyšní? Systém doporučování využívá mnoho stránek a služeb, ovšem YouTube se musí vypořádat se třemi faktory:

  • Objem: Na YouTube najdete miliardy aktivních videí. Algoritmus tedy musí pracovat s ohromným množstvím dat. Na astronomická čísla se můžete podívat zde.

  • Aktuálnost: Každou minutu uživatelé nahrají 400 hodin videa. I ty musí software zpracovat a vyhodnotit jejich relevanci pro každého individuálního člověka.

  • Šum: V prodejně elektroniky jsou návrhy jednoduché. Když někdo brouzdá notebooky, doporučíte mu pod produktem jiný notebook nebo příslušenství. Ale uživatelské chování na YouTube je jen extrémně těžko předvídatelné. Někdy máte chuť si pustit energickou hudbu, jindy se zasmát u youtubera, večer si pustit tutoriál na zavázání kravaty a v noci teskné soundtracky. Úkolem algoritmu je najít ve vašem chování některé vzorce a na základě nich pak doporučovat.

Algoritmus v současnosti vyvíjí tým Google Brain - nejlepší mozky z Alphabetu zabývající se umělou inteligencí (AI). Algoritmus si samozřejmě YouTube střeží, ovšem jeho fungování zveřejnil (PDF, anglicky). Pokud se nechcete prokousávat složitější angličtinou, zkusíme si to zjednodušit.

Vysvětlení jednodušeFiltr přes dvě síta

Aby se AI prokousala množstvím videí a vybrala tucet vám šitých na míru, používá dvě síta. Tím prvním je generování kandidátů (candidate generation). To zúží díky vaší historii a kontextu (demografických údajů, lokace, slov ve vyhledávání) výběr řádově ze stamilionů na stovky.

Tento zlomek projde druhým sítem nazvaným hodnocení (ranking), které přidělí díky testování v reálném čase každému videu skóre - a jen ty nejvyšší si zaslouží místo na vaší hlavní stránce nebo pravém panelu návrhů.

Schéma sít

Do roku 2012 se autoři odměňovali za počet zhlédnutí - tedy kliknutí na video. Vznikala tak clickbaitová videa, u kterých ovšem uživatelé nevydrželi. Alphabet proto v roce 2012 vytvořil nové ústřední pravidlo. Nejdůležitější je délka sledování videa a uživatelé, kteří je chodí sledovat pravidelně, ostatní je podružné.

Je proto pravděpodobné, že se vám budou objevovat videa, která jste již viděli. Pokud u nich strávíte delší dobu a kliknete na ně dle nálady tu a tam znovu, YouTube nemá důvod vám ho opět nedoporučit, dokud vás neomrzí. Typickým příkladem jsou dlouhé mixy hudby nebo hodiny záznamu bouřky, které si lidé pouští jako podcast a doposlouchají celé.

Vysvětlení složitějiNeuronová síť nám studuje podvědomí

A teď se ponořme více do hloubky. Předchůdcem současného softwaru byla tzv. maticová faktorizace. Složitě znějící sousloví značí metodu doporučování na základě předchozí činnosti, v níž hledá skryté vzorce. Ty pak zpřesňují preference daného uživatele a lépe vyfiltrují výsledky. Výhodou maticové faktorizace je adaptace na změny, tedy v našem případě nával nových videí nebo měnící se zájem uživatele.

Podle vývojářů Googlu je tato metoda zbytečně složitá. Vyvinuli proto neuronovou síť, která z faktorizace vychází a zjednodušuje ji. Algoritmus se opírá primárně o naši historii spolu se zmíněnými skrytými náznaky, které jdou podle vývojářů do hloubky více než řízená zpětná vazba (líbí/nelíbí se mi, dotazníky). Můžeme si to představit tak, že metoda spíše než z vědomí čerpá z našeho podvědomí.

Vyhledávání hraje roli

Schéma zúžení výběru

Schéma zúžení výběru

Pro software je stejně důležitá historie sledování jako hledání. Cokoli, co zadáte do vyhledávače, se zaindexuje a promítne do následných návrhů. Nehledě na to, jestli jste na nalezená videa klikli. Do souhrnu dat se přidají demografické údaje - věk, pohlaví i stát, to vše má o vás Google k dispozici. Vývojáři si uvědomují, že uživatelé preferují nová videa, a proto i datum publikace se řadí mezi klíčové faktory.

Prvním sítem projde jen pár stovek videí. Díky zúženému vzorku se může v druhém sítu zapojit faktorů mnohem více. Některé z nich jsou binární, tedy mají pouze dva možné výsledky (např. je-li uživatel přihlášen). Většina má miliony různých variant (např. poslední hledaný výraz) a kategorií jsou stovky. Software je musí rychle zpracovat, ovšem vývojáři přiznávají, že neuronová síť v reálném čase všechny faktory nestíhá a pracuje s tím, co aktuálně má.

Učte děti programovat, radí expertka z Googlu. Umělá inteligence je překvapivě stará

Kromě toho se do hry zapojují nejen atributy uživatele, ale i samotného videa. Je přehráváno více v Brazílii? Proklikli se na něj lidé z tohoto videa? Podobně si software zjišťuje váš zájem o kanály. Sledujete jeho videa pravidelně? Proč u nich nevydržíte do konce? Proč jste přestali kanál odebírat?

Ze získaných dat pak algoritmus vygeneruje pro video nominální skóre, které se odvíjí od předpokladu dvou věcí - zda na něj kliknete a jak dlouho na něm strávíte. Štve vás nějaké video, které se vám neustále zobrazuje? Je to tím, že má vysoké skóre. Snížit ho můžete tak, že ho budete ignorovat, dokud nezmizí, nebo na něj kliknete a po vteřině utečete pryč. Přesně to totiž software nemá rád.

Trendy„Pozitivní diskriminace“ v praxi

Na hlavní stránce se setkáte i s tzv. trendy. Jde o panel videí, která jsou aktuálně populární. Ale popularita není vše. „Některé trendy jsou předvídatelné, jako nová píseň od známého interpreta, jiné jsou ovšem zcela překvapivé. Proto se snažíme o kombinaci popularity a novinek,“ píší vývojáři.

Pořadí trendů (#1, #2...) se určuje zejména podle rychlosti růstu zhlédnutí, místa vzniku a dalších faktorů. Proto video s největším počtem zhlédnutí nemusí být nutně na prvním místě. Že počty zhlédnutí nehrají hlavní roli potvrzuje i známý český youtuber Tary.

YouTube zkouší nahradit pozadí i bez zeleného plátna

„Ještě před rokem se do trendů dostalo téměř vše, co mělo abnormální počet lajků a komentářů. A díky tomu jsem získal 400 tisíc odběratelů za rok. Fungovalo to tak, že jsem řekl: Pojďme hecnout 50 tisíc lajků. Uživatelé to zvládli, Youtube poznal, že to je trendy a hodil to tam. A to samé platilo u komentářů,“ popisuje úspěšný youtuber.

Od prosince loňského roku se ovšem systém výběru proměnil. „V trendech se nově objevují i videa s málo zhlédnutími i lajky. Je to díky kategorii, kam spadají. YouTube zřejmě vymezil určité kvóty z jednotlivých kategorií,“ říká Tary. Například vlog z jízdy na motorce může být méně úspěšný než hudební novinky, ale díky kategorii auto-moto se do trendů zařadí.

ManipulaceOvlivňuje umělá inteligence běh společnosti?

V poslední době se řeší vliv fake news na výsledky voleb. Otázkou je, jestli nás více neovlivňuje něco „z vlastních řad“. O hrozbě YouTube na mínění populace promluvil pro The Guardian jeden z těch, kdo vidí pod pokličku - vývojář algoritmu návrhů.

„YouTube se tváří jako realita, ale je pokřivená, abychom na něm trávili více času,“ říká francouzský programátor Guillaume Chaslot. Google ho propustil v roce 2013. Oficiální důvod: výkonnostní problémy. Chaslotova verze: snažil se prosadit změnu, aby byl algoritmus „víc fér“.

Rusko zkouší ovlivnit dění všude po světě. Jinak, než si většina myslí

Představy o ruských hackerech jsou často zjednodušené (ilustrační snímek)

Po padáku se začal do hloubky věnovat strojovému učení, na kterém se spolupodílel. A během amerických prezidentských voleb si všiml menší anomálie. „Bylo to zvláštní. Nezávisle na tom, jestli jste začali hledat Trumpa nebo Clintonovou, návrhy videí vás tlačily do protrumpovské oblasti,“ říká Chaslot.

Autor článku v The Guardian Paul Lewis se rozhodl jeho teorii prověřit. Prošel tisícovku nejúspěšnějších videí spojených s volbami a došel k šokujícímu skóre: 551:92 (360 neutrálních). YouTube šestkrát častěji doporučoval videa, která pomáhala Trumpovi než Clintonové. Algoritmus tak jistě nebyl přednastaven, ale díky uživatelskému jednání se tak začal chovat. Jednoduše řečeno: lidem se více líbila videa o Trumpovi, tak je YouTube začal doporučovat.

Chaslot spustil vlastní stránku algotransparency.org, kde vysvětluje, jak dle něj YouTube propaguje konspirační teorie nebo upřednostňuje některé volební kandidáty.

Z pohledu uživateleJak mohu doporučení ovlivnit?

No a jak můžete přímo vy zasáhnout do nabízení videí? Jako uživatelé máte vícero možností. Jedním z nich je přihlášení: „Když začnete sledovat videa přihlášení, budete dostávat více personalizované návrhy,“ vysvětluje pro Technet Alžběta Houzarová z Googlu.

„Pokud nejste s doporučeními spokojeni, videa, kanály a sekce, které vás nezajímají, můžete odstranit a svá doporučení tak vylepšit.“ To můžete udělat pomocí funkce Nezajímá mě.

Nezajímá mě

„Pokud z jednoho kanálu odstraníte dvě nebo více videí, tento kanál už vám nebude doporučován,“ pokračuje Houzarová. „V případě, že jste omylem odstranili doporučení, která chcete zachovat, můžete jej klepnutím na tlačítko Zpět vrátit. To je v tuto chvíli možné pouze na počítači.“

Je také možné, že jste odstranili kanály, které vás nezajímaly, a nyní již ano. To napravíte na stránce history.google.com, kde kliknete na otevřenou nabídku a poté na „Zpětná vazba Nezajímavé“. Doporučení obnovíte kliknutím na „Smazat zpětnou vazbu“. A doporučení můžete ovlivnit i v historii vyhledávání.

„Řekněme, že jste hledali určité téma, například výměnu řetězu kola. Ale teď je to ve vašich doporučeních samé video s koly. Stačí přejít do historie sledování a vyhledávání a vymazat tato konkrétní videa a výrazy,“ doplňuje Houzarová s varováním, že vymazání nelze vrátit zpět.

Příště se podíváme pod pokličku jiné softwarové zbraně YouTubu - programu Content ID, který bdí nad autorskými právy a blokuje videa, která dle něj kopírují obsah.




Nejčtenější

Největší vzducholoď Zeppelin je v Praze. Podívejte se na přistání

Netradiční pohled se naskytl Pražanům i lidem, kteří bydlí mezi hlavním městem...

Netradiční pohled se dnes naskytl Pražanům i lidem v Česku, jimiž nad hlavami proletěla největší komerční vzducholoď...

Libeňský most nejde zachránit. Stavěli ho starou technologií, práci odbyli

Libeňský most

Nejde opravit tak, aby vydržel sto let, shodují se odborníci na mostní konstrukce a beton. Libeňský most je postaven...



Někdo zřejmě tajně vyrábí látky ničící ozónovou vrstvu. Ale kdo a kde?

Ozonová díra, jako je nad Antarktidou na snímku, nad Arktidou není. Zatím.

Množství látek poškozujících ozónovou vrstvu v posledních letech klesá překvapivě pomalu, ohlásili vědci. Někde zřejmě...

Zaostalí Arabové měli strach ze vzdělaných židovských přistěhovalců

Demonstrace proti nové Bílé knize omezující židovskou migraci do Palestiny, 1939

Před 70 lety byl založen stát Izrael. Co vše tomuto aktu předcházelo, co vadilo Arabům na Židech vracejících se do své...

Americká revoluce v námořním válčení. Připlouvá mořský dron Sea Hunter

Americký námořní dron Sea Hunter

Americká DARPA dokončila vývoj námořního dronu Sea Hunter. K jeho hlavním úkolům patří vyhledávání a sledování...

Další z rubriky

Budoucnost má hlas roztržité sekretářky. Google umí napodobit telefonát

Google předvedl digitální asistentku, která za vás vyřídí telefonáty. A druhá...

„Ehm, ráda bych rezervovala něco na třetího května,“ zní v telefonu nejistý hlas. Kadeřnice netuší, že na druhé straně...

Sekunda, která rozděluje svět. Půlka lidí slyší něco jiného než vy

Slyšíte na nahrávce „Laurel“ nebo „Yanny“?

Laurel nebo Yanny? Touto zvukovou kontroverzí žily americké sociální sítě celý týden. Půlka lidí totiž na nahrávce...

Facebook zvažuje spuštění vlastní kryptoměny. Dočkáme se Facecoinu?

Facebook hodlá spustit vlastní kryptoměnu.

„Myslí to vážně,“ komentuje jeden z anonymních zdrojů plán Facebooku na spuštění vlastní kryptoměny. Po neúspěchu...

Advantage Consulting, s.r.o.
SERVISNÍ TECHNIK JUNIOR

Advantage Consulting, s.r.o.
Královéhradecký kraj, Pardubický kraj
nabízený plat: 26 000 - 30 000 Kč

Najdete na iDNES.cz