iDNES.cz

Premium

Získejte všechny články
jen za 89 Kč/měsíc

Google si buduje lidskou armádu. Počítače nás zapřáhnou a předpoví budoucnost

5. listopadu 2009

Facebook, Google a další velké společnosti dokážou využít každé naše kliknutí. A díky vynalézavým hrám jsou dnes počítače schopny využít k jinak neřešitelným úkolům schopnosti lidského mozku a pochopit význam obrazu, textu nebo videa. A nejedná se jen o teorii.

Zvětšit fotografii

Počítačové systémy umožňují využít vstup z lidského mozku a přetavit jej v užitečná, obecná data. | foto: Profimedia.cz

Jsou věci, které ani nejlepší počítačové programy zatím nedokážou, třeba rozpoznávat objekty na fotografii a jejich význam v kontextu. Lidem to naopak nedělá problém. O počítačích jsme vždy přemýšleli jako o strojích, které pomáhají lidem tam, kde kde lidé nejsou až tak silní v kramflecích, třeba v aritmetice nebo statistice. Ale existuje i opačný pohled: lidé pomáhají strojům tam, kde algoritmus zatím nestačí.

Programátoři už přišli na to, jak zapřáhnout lidské mozky a využít náš čas, naše zkušenosti a náš úsudek - velmi podobně, jako se využívá podprogram nebo matematická funkce. Tímto způsobem například Google popisuje obrázky na internetu nebo zpřesňuje výsledky vyhledávání. Ale důsledky mohou být mnohem komplexnější a dalekosáhlejší. Nebo je to všechno jenom hra?

Nový vyhledávač = lidé + algoritmus

Společnost Google má velký cíl: "Organizovat všechny informace na světě a učinit tyto informace obecně dostupné a užitečné." Když začali dva studenti Stanfordu, dnes slavní manažeři Larry Page a Sergey Brin, v roce 1996 systematicky stahovat celý tehdejší obsah webu na svůj počítač, učinili první krok k vytvoření dnes nejmocnějšího vyhledávače. Díky algoritmu PageRank mohli automatizovaně na základě matematických vzorečků a hypertextových odkazů vypočítat relativní důležitost každé stránky - nemuseli zaměstnávat tisíce lidí, kteří by za ně třídili odkazy do kategorií, jak bylo v tehdejším světě "webových katalogů" zvykem.

Jejich strategie se ukázala jako úspěšná; počítače dokázaly velmi dobře rozpoznat, která stránka nabízí relevantní informace o kterém tématu. Počítače stránkám samozřejmě nerozuměly (a dodnes rozumí jen velmi, velmi omezeně), informace o důležitosti už tam ale ukrytá byla - v odkazech, kterými jim důvěru projevily ostatní stránky.

Google tak svým PageRankem využil tuto dosud nevyužitou práci, akumuloval veškerá data a výsledkem je vyhledávač, který se stal synonymem pro vyhledávání a dominuje trhu s téměř dvoutřetinovým celosvětovým podílem. Velkou zásluhu na tom měl právě fakt, že Google využil práci lidí (vytváření odkazů), která byla dostupná zdarma. A dělá to pořád a stále vynalézavěji.

Google koupil systém reCAPTCHA

Chytrý vynález umožní Googlu snáze rozšifrovat nečitelný obsah starých i nových knih dostupných skrze Google Books

Systém reCAPTCHA je implementován na tisícovkách stránek po celém světě. Jde o nástroj zdarma a efektivně filtrující spam v internetových diskuzích nebo přihlašovacích formulářích.

Google akvizicí reCAPTCHY získal velmi účinný nástroj "crowd computing" - lidé pomáhají počítačům s úkoly, které počítače zatím nezvládají, jako je třeba čtení starých knih nebo převod obrázku na text.

reCAPTCHA - počítač zná význam pouze jednoho obrázku ze dvou. Vy opíšete texty oba a počítač tak může jak ověřit, že jste text skutečně přečetli, tak se naučit něco nového.

Více o systému reCAPTCHA

Lidé si hrají a počítače se učí

"Přečti tyhle čtyři písmena!" Úkol, který je pro člověka až směšně snadný, je pro počítače velmi obtížný. CAPTCHA umožňuje odlišit člověka od naprogramovaného robota. Každý den se po světě vyplní miliony těchto bezpečnostních kódů. Luis von Ahn z Carnegie Mellon univerzity, vynálezce CAPTCHY, jde ovšem mnohem dál - podle něj je možné tuto lidskou práci využít, zapřáhnout.

Lidi můžeme pojmout jako procesory, které umí vyřešit úlohy jinak neřešitelné. Jde jen o to, jak tyto procesory implementovat.

"V roce 2003 bylo na celém světě odehráno přibližně 9 miliard hodin Solitéru," říká ve své fascinující přednášce v rámci Google Tech Talks. To je více než tisíckrát víc "člověkohodin", než kolik jich bylo zapotřebí k vybudování Empire State Building. Luis věří, že tyto hodiny, které lidé tráví hraním, mohou být využity k úkolům, které jsou zatím konvenčními počítačovými algoritmy neřešitelné. "Na lidský mozek můžeme nahlížet jako na velmi komplexní procesor, který můžeme zapřáhnout do našeho algoritmu a pracovat s ním jako se strojem. (...) Zatím lidé na počítačích parazitují. Já navrhuji mnohem vyrovnanější vztah, kdy některé problémy vyřeší počítače a některé řeší lidé..." Jeho cílem je využití nevyužitých "lidských procesů" k řešení složitých, tzv. otevřených problémů dnešní informatiky.

Jedním takovým problémem je třeba popsání obrázku - počítač má problém poznat s dostatečnou jistotou, zda je na obrázku automobil, kočárek, medvěd, zda obrázek působí depresivně nebo optimisticky... Člověk s ničím takovým problém nemá. Jak ale přimět velké množství lidí, aby dobrovolně, ve velkém a zadarmo spolupracovali?

Vzpomeňme na Solitér. Necháme je hrát!

Luis je autorem hry "ESP Game", která slouží k popisu milionů obrázků z celého internetu. Funguje jednoduše: přihlásíte se do hry a systém vás spáruje s lidským partnerem. Oběma vám zobrazí stejný obrázek a vy máte za úkol shodnout se se svým partnerem na popisku tohoto obrázku. Když se shodnete, počítač ví, že jste mu pravděpodobně poskytli pravdivou informaci o tom, co je na obrázku. Uloží si ji do databáze a vám dá body.

Google Image Labeler vychází z ESP Game - Google využívá data k vylepšení výsledků vyhledávání, například v Google Images.

Hru Google Image Labeler si můžete vyzkoušet zde (anglicky)

Mohlo by se zdát, že tento koncept je nereálný, ovšem realita má tendenci překonat i ty nejnadsazenější odhady. Během pár měsíců se hráči shodli na 15 milionech popisků. Někteří hráli hru i dvacet hodin v kuse a Luis musel omezit maximální počet her na jednu osobu za den, protože měl výčitky, že někomu ničí zdraví.

Hráči nicméně věděli, že jde o hru "s přesahem" a že takto poskytují data k další analýze. Ale vůbec jim to nevadilo a dodnes nevadí. Hra je zajímavá, pokaždé jiná a díky faktoru náhody a podivně intimního kontaktu s druhou osobou neztrácí na zajímavosti ani tři roky po svém spuštění. Google Image Labeler pomohl od roku 2006 popsat velké množství obrázků; je docela možné, že většinu obrázků z Google Image Search. Nejenže se tak zpřesnilo vyhledávání v obrázcích, ale Google může tato data používat i pro lepší indexaci stránek, na kterých se tyto obrázky nacházejí.

Další hry využívající lidského výpočetního výkonu

"Human Computing", tedy zapřažení lidského vstupu při počítačovém řešení problémů, využívají i další hry:

Ve hře Squigl se se spoluhráčem snažíte shodnout na obrysu daného objektu na obrázku. Slova jsou výsledkem již zmíněné ESP Game, takže nyní už počítač bude vědět nejen co na obrázku je, ale i kde se to nalézá.

Další hry si dokonce kladou ještě vyšší cíle - počítač by díky hře Verbosity měl "pochopit" všechno to nepřeberné množství faktů, které my lidé známe jaksi automaticky: že slunce svítí a hřeje, na housle se hraje, z okna se kouká, mléko se smíchá s vločkami, noviny se čtou...

Hra Verbosity - jeden z parterů dostane slovo a má jej druhému napovědět. K dispozici má několik přísně strukturovaných vět, které může doplnit. Počítač by teoreticky měl takto získat miliony konkrétních, gramaticky zařaditelných vědomostí, později využitelných třeba v sémantickém webu.

Tyto a další hry naleznete na gwap.com

Dokud je hra zábavná, vstup jasně daný a také statisticky ověřitelný, jsou výstupy z těchto her obvykle velmi dobře využitelné. Luis zdůrazňuje, že počítač je často jako "někteří profesoři, kteří vám dají test, který by sami nedokázali vyplnit, ale umějí jej oznámkovat." Armáda hráčů je schopna těmto počítačům poskytnout enormní množství dat ve velmi krátkém čase.

Celý web jako hra

Můžeme se usmívat nad tím, jak mají někteří lidé moc volného času, jak nevědí, do čeho píchnout a baví se popisováním obrázků na webu. Jenže, podíváme-li se na naši vlastní on-line existenci, najdeme zajímavé paralely právě s podobnými "human computing" hrami.

Tak především celý úspěch Googlu coby relevantního full-textového vyhledávače spočíval v tom, že dokázal využít doposud podceňovaný lidský vstup - odkazy. Podobně jako při popisu obrázků se musí dva lidé shodnout na stejném znění, pokud se dva a více lidí shodnou v odkazu na nějakou stránku na určitém slově, může mít Google relativní jistotu, že je toto slovo pro odkazovanou stránku podstatné (bez ohledu na to, zda se na dané stránce nachází - však takto vznikaly Google Bomby).

Těch vstupů, které počítačům po celém světě (nejen těm od Googlu) poskytujeme, je mnohem více. Kdykoli klikneme na nějaký odkaz, dáváme tím něco najevo. Kdykoli okomentujeme článek, zakoupíme produkt, hodnotíme knížku, vyhledáváme informace, posíláme e-mail nebo uploadujeme obrázek, učíme "Web" novým a novým skutečnostem. Pěkně to demonstruje video Dr. Michaela Wesche o Web 2.0: The Machine Is Using Us (Stroj používá nás).

Velká část těchto vstupů je zcela nenápadných - ani nás nenapadne, že by je někdo mohl analyzovat. A skutečně, není v lidských silách takové množství maličkostí brát v potaz v reálném čase. Nicméně v silách obrovských výpočetních center to zcela jistě je. Stačí správě nastavit parametry, filtry, statistické metody a další technické podružnosti. Každý z nás produkuje denně dostatek dat, ať už anonymních nebo s námi přímo identifikovatelných. Každý z nás je součástí této armády, každý přikládá ruku k dílu, kurzor k odkazu.

Předpovíme budoucnost

Psychomanipulátor Derren Brown nedávno předvedl, jak "davová inteligence" dokáže předpovědět budoucnost - konkrétně čísla tažená v loterii. Toto je zřejmý nesmysl, šlo o druh iluze a efektní vystoupení, ne o nějaký projev davové inteligence. Dvacet lidí neví, jaký míček vypadne z náhodného osudí o nic lépe než dva.

Ovšem davová inteligence umí předpovídat jiný druh budoucnosti - budoucí trendy. A ty jsou pro velké společnosti mnohem cennější než informace o loterii. Vědět, co bude za týden lidi zajímat nebo co budou za dva měsíce kupovat, to je pro podnikání neuvěřitelně důležité. Existuje mnoho více či méně nejistých metod, jak se lidem dostat pod kůži a něco o nich vyzvědět. Ale málokdy se můžeme lidí ptát na jejich budoucnost a očekávat jasné, reálné odpovědi.

Vše, co na internetu děláme, může někomu sloužit k předpovědi budoucích trendů - obecných i individuálních. Je to jen otázka vhodného statistického zpracování dat.

Ovšem sítě jako Facebook nebo Twitter mají k takovým odpovědím jen krůček. Všechna data, ze kterých mohou tyto odpovědi uvařit, již mají, nebo jich mají alespoň dostatečné množství na jisté druhy předpovědí. Nyní je jenom třeba všechna tato data zpracovat: vzájemné vztahy lidí, příslušnost k různým skupinám, frekvence a obsah vzájemných kontaktů, výsledky a témata těch zpropadených kvízů, odkazy, komentáře... Není jednoduché z této směsice ukuchtit něco užitečného. Ale až se to povede (a je dost možné, že se to už dlouho daří), bude mít výsledný pokrm velmi vysokou prodejní cenu.

Google má už dnes přístup k tomu, co lidé hledají. Také má dobrou představu o tom, kde to nalézají. Od března sleduje, o co se zajímáte a jaké reklamy by nejvíce zaujaly vaši pozornost. Nově také v reálném čase prohledává nové statuty na Twitteru. Ačkoli se tyto 140znakové hlášky mohou zdát nesmyslné, vyjadřují možná nejinstantnější, nejrychleji dostupné, zkoncentrované a prohledávatelné názory lidí z celého světa. Když už neumožní předpovídat budoucnost, pak jistě alespoň současnost.

Jedeme v tom všichni

Možná se cítíte podvedeni, jako někdo, kdo pomohl Tomu Sawyerovi natírat plot a ještě mu za to zaplatil. Ale možná k tomu není důvod. Plíživý nástup technologií přinesl mnoho změn do našich životů a proměnil výrazně celou společnost. V lidské posedlosti pokrokem a technologiemi můžeme hledat příčiny (i když ne ty primární) dnešní situace, kdy soukromí získává poněkud jiný význam, než mělo před dvaceti lety.

Ale možná podvedeni vůbec nejsme. Členy armády Google, Facebooku nebo Twitteru jsme se nestali pod nátlakem. Naopak, nadšeně těchto novinek využívají lidé po celém světě, často nad rámec toho, nakolik by se mělo důvěřovat jakékoli technologii. To, že jsou naše akce sledovatelné a zpětně využitelné (ať už v náš nebo všech nebo jen něčí prospěch), to je nezbytný důsledek současné architektury globálního a komunikačního prostředí.

V nejbližších letech budeme, doufejme, svědky mnoha debat o tom, jak tyto změny proměňují a znovudefinují podnikání, politiku, zábavu nebo mezilidskou komunikaci. (Tento článek je ostatně pokusem poskytnout k takovýmto debatám možnost pochopení některých souvislostí.) Ovšem těžko se v těchto debatách můžeme vymlouvat na nátlak nebo nepřiměřené donucovací prostředky.

Do internetové armády jsme se zapsali sami. Každý den znovu a dobrovolně.

Odkazy a zdroje:

Google začal prohledávat tweety (anglicky)
Human Computing - Luis von Ahn, Google Talk (anglicky)
Peekaboom: hra pro lokalizaci objektů na fotografii (anglicky, PDF)
Den na cele myšlenkových zločinů (anglicky, povídka)
We Are the Web (WIRED, anglicky)
Google a vaše soukromí - videa (anglicky)
Nákupem reCAPTCHY získal Google "davový počítač" (anglicky)
Reklamy cílené podle zájmů uživatele (anglicky)
Google nabízí možnost odhlásit se ze sledování (anglicky)
Parodie: Google opt-out village (The Onion, anglicky)

Autor: Pavel Kasík

Témata: Akvizice, Facebook, Google, Google+, Kvíz, Larry Page, Loterie, Medvědi, Motorola, počítač, Robot, Sergey Brin, X (dříve Twitter)

Komerční sdělení

Zázrak! NASA po pěti měsících obdržela od sondy Voyager smysluplnou zprávu

v diskusi je 179 příspěvků

23. dubna 2024 13:37

Když se v únoru letošního roku stále nedařilo navázat smysluplnou komunikaci s jedním z...

Herečce Slávce Budínové by bylo 100 let. Zemřela opuštěná, bez zájmu veřejnosti

v diskusi je 30 příspěvků

21. dubna 2024

Před 100 lety, 21. dubna 1924, se v Ostravě narodila známá česká herečka Slávka Budínová.

{NADPIS reklamního článku dlouhý přes dva řádky}

{POPISEK reklamního článku, také dlouhý přes dva a možná dokonce až tři řádky, končící na tři tečky...}

Proč umělá inteligence lže a proč kvůli ní zhloupneme. Počítačový expert vypráví

v diskusi je 17 příspěvků

22. dubna 2024

Premium Zatímco průmyslová revoluce zaváděla masivní využití strojů, které nahradily lidské svaly, nyní...

Byla to druhá nejjasnější hvězda. V budoucnu může svítit jako druhý Měsíc

v diskusi je 17 příspěvků

21. dubna 2024

Velmi neobvyklá hvězda éta Carinae v devatenáctém století náhle zjasnila a stala se druhou...

{NADPIS reklamního článku dlouhý přes dva řádky}

{POPISEK reklamního článku, také dlouhý přes dva a možná dokonce až tři řádky, končící na tři tečky...}

Dnes už se bez nich válčit nedá. Raketový vzestup bojových dronů

v diskusi je 47 příspěvků

24. dubna 2024

Bezpilotní letadla (drony) jsou v posledních dvou dekádách na raketovém vzestupu. Přispěla k tomu...

Čekání na české lidové auto nemělo konce. Před 100 lety jezdili jen boháči

v diskusi je 8 příspěvků

28. dubna 2024

Před 100 lety Čechoslováci marně čekali na tuzemské lidové auto. Drtivá většina obyvatel si totiž...

KVÍZ generála Pattona. Vypořádejte se s ocelovou lavinou

v diskusi nejsou příspěvky

28. dubna 2024

Jak jste dobří v tancích, poznáte je nejen na plese, ale i v následujícím kvízu? Je zaměřen na...

Pomník Jana Žižky na Vítkově vznikal skoro 30 let

v diskusi je 10 příspěvků

27. dubna 2024

27. dubna 1924 zahájil Spolek pro zbudování pomníku Jana Žižky na Žižkově veřejnou sbírku na jeho...

Přistávat s vrtulníkem je jako balancovat na míči a zůstat při tom něžný

v diskusi jsou 4 příspěvky

27. dubna 2024

Mysli na to, že při záchraně druhých nesmíš sebe ani nikoho jiného ohrozit. Tak zněla jedna z...

Samoživitelka skončila v nemocnici a čtvrt roku nemohla pracovat

Téměř deset miliard korun – tolik jen za loňský rok poslaly pojišťovny lidem za úrazy, závažná onemocnění či úmrtí. Životní pojištění pomohlo za...

Bývalý fitness trenér Kavalír zrušil asistovanou sebevraždu, manželka je těhotná

Bývalý fitness trenér Jan Kavalír (33) trpí osmým rokem amyotrofickou laterální sklerózou. 19. dubna tohoto roku měl ve...

Tenistka Markéta Vondroušová se po necelých dvou letech manželství rozvádí

Sedmá hráčka světa a aktuální vítězka nejprestižnějšího turnaje světa Wimbledonu, tenistka Markéta Vondroušová (24), se...

Horňáci versus dolňáci. Víme, čemu muži dávají přednost, a je to překvapení

Ženské tělo je pro muže celkově velmi atraktivní a nabízí jejich očím mnoho zajímavých partií. Největší pozornosti se...

Hello Kitty slaví padesátiny. Celý svět si myslí, že je to kočička, jenže není

Kulatý obličej se dvěma trojúhelníkovýma ušima, drobný čumáček, vousky a červená mašle na uchu. Taková je Hello Kitty,...

Za vytlačení z linky do Brna musí Student Agency zaplatit náhradu 21 milionů

Společnost Student Agency provozující autobusy a vlaky pod označením RegioJet musí zaplatit bývalému konkurentovi 21...

Herní technika

Finance

Osobnosti

Elektromobilita

Termíny

Válka na Ukrajině

Nepřehlédněte

iDNES.cz

© 1998–2024 MAFRA, a. s. a dodavatelé Profimedia, Reuters, ČTK, AP. Rozmnožování obsahu pro účely automatizované analýzy textů nebo dat dle ustanovení § 39c autorského zákona je bez souhlasu MAFRA, a. s. zakázáno. Jakékoliv užití obsahu včetně převzetí, šíření či dalšího zpřístupňování článků a fotografií je bez souhlasu MAFRA, a. s. zakázáno. Provozovatelem serveru iDNES.cz je MAFRA, a. s. IČ: 45313351.

mobilní verze

Přihlášení