Počítačové systémy umožňují využít vstup z lidského mozku a přetavit jej v užitečná, obecná data.

Počítačové systémy umožňují využít vstup z lidského mozku a přetavit jej v užitečná, obecná data. | foto: Profimedia.cz

Google si buduje lidskou armádu. Počítače nás zapřáhnou a předpoví budoucnost

  • 107
Facebook, Google a další velké společnosti dokážou využít každé naše kliknutí. A díky vynalézavým hrám jsou dnes počítače schopny využít k jinak neřešitelným úkolům schopnosti lidského mozku a pochopit význam obrazu, textu nebo videa. A nejedná se jen o teorii.

Jsou věci, které ani nejlepší počítačové programy zatím nedokážou, třeba rozpoznávat objekty na fotografii a jejich význam v kontextu. Lidem to naopak nedělá problém. O počítačích jsme vždy přemýšleli jako o strojích, které pomáhají lidem tam, kde kde lidé nejsou až tak silní v kramflecích, třeba v aritmetice nebo statistice. Ale existuje i opačný pohled: lidé pomáhají strojům tam, kde algoritmus zatím nestačí.

Programátoři už přišli na to, jak zapřáhnout lidské mozky a využít náš čas, naše zkušenosti a náš úsudek - velmi podobně, jako se využívá podprogram nebo matematická funkce. Tímto způsobem například Google popisuje obrázky na internetu nebo zpřesňuje výsledky vyhledávání. Ale důsledky mohou být mnohem komplexnější a dalekosáhlejší. Nebo je to všechno jenom hra?

Nový vyhledávač = lidé + algoritmus

Společnost Google má velký cíl: "Organizovat všechny informace na světě a učinit tyto informace obecně dostupné a užitečné." Když začali dva studenti Stanfordu, dnes slavní manažeři Larry Page a Sergey Brin, v roce 1996 systematicky stahovat celý tehdejší obsah webu na svůj počítač, učinili první krok k vytvoření dnes nejmocnějšího vyhledávače. Díky algoritmu PageRank mohli automatizovaně na základě matematických vzorečků a hypertextových odkazů vypočítat relativní důležitost každé stránky - nemuseli zaměstnávat tisíce lidí, kteří by za ně třídili odkazy do kategorií, jak bylo v tehdejším světě "webových katalogů" zvykem.

Jejich strategie se ukázala jako úspěšná; počítače dokázaly velmi dobře rozpoznat, která stránka nabízí relevantní informace o kterém tématu. Počítače stránkám samozřejmě nerozuměly (a dodnes rozumí jen velmi, velmi omezeně), informace o důležitosti už tam ale ukrytá byla - v odkazech, kterými jim důvěru projevily ostatní stránky.

Google tak svým PageRankem využil tuto dosud nevyužitou práci, akumuloval veškerá data a výsledkem je vyhledávač, který se stal synonymem pro vyhledávání a dominuje trhu s téměř dvoutřetinovým celosvětovým podílem. Velkou zásluhu na tom měl právě fakt, že Google využil práci lidí (vytváření odkazů), která byla dostupná zdarma. A dělá to pořád a stále vynalézavěji.

Google koupil systém reCAPTCHA

Chytrý vynález umožní Googlu snáze rozšifrovat nečitelný obsah starých i nových knih dostupných skrze Google Books

Systém reCAPTCHA je implementován na tisícovkách stránek po celém světě. Jde o nástroj zdarma a efektivně filtrující spam v internetových diskuzích nebo přihlašovacích formulářích.

Google akvizicí reCAPTCHY získal velmi účinný nástroj "crowd computing" - lidé pomáhají počítačům s úkoly, které počítače zatím nezvládají, jako je třeba čtení starých knih nebo převod obrázku na text.

reCAPTHCA - ukázka

reCAPTCHA - počítač zná význam pouze jednoho obrázku ze dvou. Vy opíšete texty oba a počítač tak může jak ověřit, že jste text skutečně přečetli, tak se naučit něco nového.

Více o systému reCAPTCHA

Lidé si hrají a počítače se učí

"Přečti tyhle čtyři písmena!" Úkol, který je pro člověka až směšně snadný, je pro počítače velmi obtížný. CAPTCHA umožňuje odlišit člověka od naprogramovaného robota. Každý den se po světě vyplní miliony těchto bezpečnostních kódů. Luis von Ahn z Carnegie Mellon univerzity, vynálezce CAPTCHY, jde ovšem mnohem dál - podle něj je možné tuto lidskou práci využít, zapřáhnout.

Lidi můžeme pojmout jako procesory, které umí vyřešit úlohy jinak neřešitelné. Jde jen o to, jak tyto procesory implementovat.

"V roce 2003 bylo na celém světě odehráno přibližně 9 miliard hodin Solitéru," říká ve své fascinující přednášce v rámci Google Tech Talks. To je více než tisíckrát víc "člověkohodin", než kolik jich bylo zapotřebí k vybudování Empire State Building. Luis věří, že tyto hodiny, které lidé tráví hraním, mohou být využity k úkolům, které jsou zatím konvenčními počítačovými algoritmy neřešitelné. "Na lidský mozek můžeme nahlížet jako na velmi komplexní procesor, který můžeme zapřáhnout do našeho algoritmu a pracovat s ním jako se strojem. (...) Zatím lidé na počítačích parazitují. Já navrhuji mnohem vyrovnanější vztah, kdy některé problémy vyřeší počítače a některé řeší lidé..." Jeho cílem je využití nevyužitých "lidských procesů" k řešení složitých, tzv. otevřených problémů dnešní informatiky.

Jedním takovým problémem je třeba popsání obrázku - počítač má problém poznat s dostatečnou jistotou, zda je na obrázku automobil, kočárek, medvěd, zda obrázek působí depresivně nebo optimisticky... Člověk s ničím takovým problém nemá. Jak ale přimět velké množství lidí, aby dobrovolně, ve velkém a zadarmo spolupracovali?

Vzpomeňme na Solitér. Necháme je hrát!

Luis je autorem hry "ESP Game", která slouží k popisu milionů obrázků z celého internetu. Funguje jednoduše: přihlásíte se do hry a systém vás spáruje s lidským partnerem. Oběma vám zobrazí stejný obrázek a vy máte za úkol shodnout se se svým partnerem na popisku tohoto obrázku. Když se shodnete, počítač ví, že jste mu pravděpodobně poskytli pravdivou informaci o tom, co je na obrázku. Uloží si ji do databáze a vám dá body.

Google Image Labeler

Google Image Labeler vychází z ESP Game - Google využívá data k vylepšení výsledků vyhledávání, například v Google Images.

Mohlo by se zdát, že tento koncept je nereálný, ovšem realita má tendenci překonat i ty nejnadsazenější odhady. Během pár měsíců se hráči shodli na 15 milionech popisků. Někteří hráli hru i dvacet hodin v kuse a Luis musel omezit maximální počet her na jednu osobu za den, protože měl výčitky, že někomu ničí zdraví.

Hráči nicméně věděli, že jde o hru "s přesahem" a že takto poskytují data k další analýze. Ale vůbec jim to nevadilo a dodnes nevadí. Hra je zajímavá, pokaždé jiná a díky faktoru náhody a podivně intimního kontaktu s druhou osobou neztrácí na zajímavosti ani tři roky po svém spuštění. Google Image Labeler pomohl od roku 2006 popsat velké množství obrázků; je docela možné, že většinu obrázků z Google Image Search. Nejenže se tak zpřesnilo vyhledávání v obrázcích, ale Google může tato data používat i pro lepší indexaci stránek, na kterých se tyto obrázky nacházejí.

Další hry využívající lidského výpočetního výkonu

"Human Computing", tedy zapřažení lidského vstupu při počítačovém řešení problémů, využívají i další hry:

Squigl

Ve hře Squigl se se spoluhráčem snažíte shodnout na obrysu daného objektu na obrázku. Slova jsou výsledkem již zmíněné ESP Game, takže nyní už počítač bude vědět nejen co na obrázku je, ale i kde se to nalézá.

Další hry si dokonce kladou ještě vyšší cíle - počítač by díky hře Verbosity měl "pochopit" všechno to nepřeberné množství faktů, které my lidé známe jaksi automaticky: že slunce svítí a hřeje, na housle se hraje, z okna se kouká, mléko se smíchá s vločkami, noviny se čtou...

Verbosity

Hra Verbosity - jeden z parterů dostane slovo a má jej druhému napovědět. K dispozici má několik přísně strukturovaných vět, které může doplnit. Počítač by teoreticky měl takto získat miliony konkrétních, gramaticky zařaditelných vědomostí, později využitelných třeba v sémantickém webu.

  • Tyto a další hry naleznete na gwap.com

Dokud je hra zábavná, vstup jasně daný a také statisticky ověřitelný, jsou výstupy z těchto her obvykle velmi dobře využitelné. Luis zdůrazňuje, že počítač je často jako "někteří profesoři, kteří vám dají test, který by sami nedokázali vyplnit, ale umějí jej oznámkovat." Armáda hráčů je schopna těmto počítačům poskytnout enormní množství dat ve velmi krátkém čase.

Celý web jako hra

Můžeme se usmívat nad tím, jak mají někteří lidé moc volného času, jak nevědí, do čeho píchnout a baví se popisováním obrázků na webu. Jenže, podíváme-li se na naši vlastní on-line existenci, najdeme zajímavé paralely právě s podobnými "human computing" hrami.

Tak především celý úspěch Googlu coby relevantního full-textového vyhledávače spočíval v tom, že dokázal využít doposud podceňovaný lidský vstup - odkazy. Podobně jako při popisu obrázků se musí dva lidé shodnout na stejném znění, pokud se dva a více lidí shodnou v odkazu na nějakou stránku na určitém slově, může mít Google relativní jistotu, že je toto slovo pro odkazovanou stránku podstatné (bez ohledu na to, zda se na dané stránce nachází - však takto vznikaly Google Bomby).

Těch vstupů, které počítačům po celém světě (nejen těm od Googlu) poskytujeme, je mnohem více. Kdykoli klikneme na nějaký odkaz, dáváme tím něco najevo. Kdykoli okomentujeme článek, zakoupíme produkt, hodnotíme knížku, vyhledáváme informace, posíláme e-mail nebo uploadujeme obrázek, učíme "Web" novým a novým skutečnostem. Pěkně to demonstruje video Dr. Michaela Wesche o Web 2.0: The Machine Is Using Us (Stroj používá nás).

Velká část těchto vstupů je zcela nenápadných - ani nás nenapadne, že by je někdo mohl analyzovat. A skutečně, není v lidských silách takové množství maličkostí brát v potaz v reálném čase. Nicméně v silách obrovských výpočetních center to zcela jistě je. Stačí správě nastavit parametry, filtry, statistické metody a další technické podružnosti. Každý z nás produkuje denně dostatek dat, ať už anonymních nebo s námi přímo identifikovatelných. Každý z nás je součástí této armády, každý přikládá ruku k dílu, kurzor k odkazu.

Předpovíme budoucnost

Psychomanipulátor Derren Brown nedávno předvedl, jak "davová inteligence" dokáže předpovědět budoucnost - konkrétně čísla tažená v loterii. Toto je zřejmý nesmysl, šlo o druh iluze a efektní vystoupení, ne o nějaký projev davové inteligence. Dvacet lidí neví, jaký míček vypadne z náhodného osudí o nic lépe než dva.

Ovšem davová inteligence umí předpovídat jiný druh budoucnosti - budoucí trendy. A ty jsou pro velké společnosti mnohem cennější než informace o loterii. Vědět, co bude za týden lidi zajímat nebo co budou za dva měsíce kupovat, to je pro podnikání neuvěřitelně důležité. Existuje mnoho více či méně nejistých metod, jak se lidem dostat pod kůži a něco o nich vyzvědět. Ale málokdy se můžeme lidí ptát na jejich budoucnost a očekávat jasné, reálné odpovědi.

Vše, co na internetu děláme, může někomu sloužit k předpovědi budoucích trendů - obecných i individuálních. Je to jen otázka vhodného statistického zpracování dat.

Ovšem sítě jako Facebook nebo Twitter mají k takovým odpovědím jen krůček. Všechna data, ze kterých mohou tyto odpovědi uvařit, již mají, nebo jich mají alespoň dostatečné množství na jisté druhy předpovědí. Nyní je jenom třeba všechna tato data zpracovat: vzájemné vztahy lidí, příslušnost k různým skupinám, frekvence a obsah vzájemných kontaktů, výsledky a témata těch zpropadených kvízů, odkazy, komentáře... Není jednoduché z této směsice ukuchtit něco užitečného. Ale až se to povede (a je dost možné, že se to už dlouho daří), bude mít výsledný pokrm velmi vysokou prodejní cenu.

Google má už dnes přístup k tomu, co lidé hledají. Také má dobrou představu o tom, kde to nalézají. Od března sleduje, o co se zajímáte a jaké reklamy by nejvíce zaujaly vaši pozornost. Nově také v reálném čase prohledává nové statuty na Twitteru. Ačkoli se tyto 140znakové hlášky mohou zdát nesmyslné, vyjadřují možná nejinstantnější, nejrychleji dostupné, zkoncentrované a prohledávatelné názory lidí z celého světa. Když už neumožní předpovídat budoucnost, pak jistě alespoň současnost.

Jedeme v tom všichni

Možná se cítíte podvedeni, jako někdo, kdo pomohl Tomu Sawyerovi natírat plot a ještě mu za to zaplatil. Ale možná k tomu není důvod. Plíživý nástup technologií přinesl mnoho změn do našich životů a proměnil výrazně celou společnost. V lidské posedlosti pokrokem a technologiemi můžeme hledat příčiny (i když ne ty primární) dnešní situace, kdy soukromí získává poněkud jiný význam, než mělo před dvaceti lety.

Ale možná podvedeni vůbec nejsme. Členy armády Google, Facebooku nebo Twitteru jsme se nestali pod nátlakem. Naopak, nadšeně těchto novinek využívají lidé po celém světě, často nad rámec toho, nakolik by se mělo důvěřovat jakékoli technologii. To, že jsou naše akce sledovatelné a zpětně využitelné (ať už v náš nebo všech nebo jen něčí prospěch), to je nezbytný důsledek současné architektury globálního a komunikačního prostředí.

V nejbližších letech budeme, doufejme, svědky mnoha debat o tom, jak tyto změny proměňují a znovudefinují podnikání, politiku, zábavu nebo mezilidskou komunikaci. (Tento článek je ostatně pokusem poskytnout k takovýmto debatám možnost pochopení některých souvislostí.) Ovšem těžko se v těchto debatách můžeme vymlouvat na nátlak nebo nepřiměřené donucovací prostředky.

Do internetové armády jsme se zapsali sami. Každý den znovu a dobrovolně.

Odkazy a zdroje: