Douglas Merrill, viceprezident společnosti Google pro inženýring a vývoj

Douglas Merrill, viceprezident společnosti Google pro inženýring a vývoj | foto: Pavel Kasík - Technet.cz

Google: Kdybychom mohli prohledat váš mozek, uděláme to

  • 63
Nejčastějším znakem v anglicky psaném textu je obyčejná mezera. I s ní si musí při vyhledávání na internetu Google poradit. Viceprezident společnosti přednášel v Praze o principech a budoucnosti internetového vyhledávání.

Douglas Merrill, viceprezident společnosti Google, také zdůraznil důležitost lokálního obsahu a nutnost neustálého vývoje. Studenty pak povzbudil, aby přišli do Googlu pracovat, případně udělali ještě lepší vyhledávač vlastní.

"Je mi ctí mluvit na univerzitě staré tři sta let o společnosti, která se zrodila teprve před devíti lety,“ začal svou přednášku na pražské ČVUT Douglas Merrill. Před deseti lety bylo totiž internetové vyhledávání v podstatě vyřešeno. "V místnosti seděli lidé a prohlíželi si stránky. Když našli stránku o fotbale, zařadili ji do kategorie Sport a podkategorie Fotbal. Dokonalé, že? Ale internet se změnil." V současné době se objem dat na internetu zdvojnásobí každých čtyři až pět měsíců. Navíc se každý měsíc změní přibližně desetina obsahu. V takové objemu dat už katalogové vyhledávače mají jen velmi malou šanci na úspěch.

 Přednáška ČVUT - Douglas Merrill

Douglas Merrill před zaplněnou posluchárnou na pražské ČVUT

Dnes světoznámý vyhledávač Google začal před devíti lety jako projekt Larryho Page a Sergeye Brinna. Oba studenti Stanfordu si prý na začátku do oka příliš nepadli. "Larry si myslel, že Sergey je uhádaný, Sergey považoval Larryho za arogantního. Nejspíš měli oba pravdu," vtipkuje Douglas Merrill, doktor psychologie, který přišel do společnosti Google teprve nedávno. "Každopádně, v rámci třídního projektu přišli s myšlenkou aplikovat na vyhledávání základní principy informační teorie." Začátek byl "jednoduchý" – dostat na počítač celý obsah tehdejšího webu a zaindexovat jej. Od té doby už Google indexuje několik miliard webových stránek z celého světa, zatímco známé katalogy tehdejší doby již dnes zcela zapadly. "Doufám, že něco z toho, co dnes řeknu, třeba vyprovokuje někoho z vás k tomu, abyste vytvořili ještě něco lepšího a ukázali, že na to jdeme špatně," povzbudil Douglas přítomné studenty.

Načíst, zaindexovat, prohledat

"Když už ten crawler proleze celý ten web, potřebujete obsah zaindexovat. Jak? Co třeba po znacích. Víte, jaký je nejčastější znak v anglicky psaném textu?"

"E!" ozvalo se z publika.

"Špatně, je to mezera!" vzal nám Douglas vítr z plachet a pokračoval výčtem dalších možností indexování. Způsob, který používá Google, ale neprozradil, pouze nás odkázal na dokumenty o Google File System.

Misí společnosti Google je "učinit veškeré informace univerzálně prohledávatelné a dostupné uživatelům." Douglas na několika příkladech ukázal, že úspěch společnosti Google tkví ve statistických algoritmech. Ve své přednášce dokonce použil české příklady (s roztomilou výslovností).

 Prezentace - Douglas Merrill

Mise Googlu teprve začíná: organizovat všechny informace na světě a učinit je univerzálně dostupné a užitečné.


"Když hledáte slovo ‚snezka‘, Google vám nabídne i slovo Sněžka. Proč si myslíte, že to tak je?" Jeden student nadhodil, že zapojují algoritmus rozpoznávající diakritiku a pak ji doplňuje do vyhledávání. "To je dobré řešení," pochválil nápad Douglas, "ale my máme lepší. Když někdo hledal slovo ‚snezka‘ a krátce poté také slovo ‚Sněžka‘ a tato korelace je statisticky významná, software se dovtípí, že se jedná o totéž slovo. Máme tak rostoucí a flexibilní databázi na základě toho, co se náš vyhledávač naučí od samotných uživatelů." Připomíná hned, že nejde o umělou inteligenci v pravém slova smyslu, jako spíše o chytré aplikování statistiky. "Nápověda je tak velice relevantní. Já sám ji někdy používám místo kontroly pravopisu, třeba zrovna slovo 'relevantní' mi dělá potíže..."

První výsledek má být ten nejlepší

Když už má Google stránky uložené, musí je nějak seřadit. "Průzkum nám ukázal, že lidé obvykle neprohlížejí druhou nebo třetí stránku s výsledky vyhledávání. Chtějí, aby nejlepší odkaz našli hned nahoře." Google používá algoritmus zvaný Page Rank (Page je Larryho příjmení). "Proč jste sem dneska přišli?" ptá se Douglas Merrill zaplněné přednáškové místnosti číslo 209. "Vždyť jste mě nikdy předtím neviděli, nepotkali jste se se mnou. Ale někdo, komu věříte, třeba vaši učitelé… no, budeme předstírat, že jim věříte… tak ti vám řekli, že já jsem někdo, koho má cenu si poslechnout. Stejně tak funguje i Page Rank – když důvěryhodné stránky odkazují na další stránky, považujeme je za důvěryhodnější než ty, na které nikdo neodkazuje."

Přednáška ČVUT - Douglas Merrill obletovaný fotografy



Page Rank ale není zdaleka jediný faktor ovlivňující pořadí výsledků. "Kromě Page Ranku je v činnosti dalších asi dvě stě atributů, které jsou brány v potaz při řazení stránek ve výsledcích." Několik stovek zaměstnanců Googlu se prý zabývá bojem se spamem. Ne snad ručním tříděním nebo jednotlivými zákazy. "Ti kluci mají fakt zajímavou práci – každý den přijdou do práce a vymýšlejí, jak by náš systém oblafli." Pak se snaží takové pokusy obecně a preventivně odfiltrovat.

Rozumět místní kultuře

"Znáte ten vtip: když mluvíte třemi jazyky, jste trilingvní, když dvěma, tak bilingvní, když jedním, jste Američan," rozesmívá Douglas už kdovípokolikáté mladé publikum. Uvozuje tak podle něj klíčovou část mise Google: "Na internetu nejsou jenom Američani. 77% uživatelů internetu není z USA a dvě třetiny stránek jsou jinou řečí než anglicky."

Používání internetu ve světě - Douglas Merrill

Google proto pracuje jak na překladu svých služeb do jiných jazyků, tak na překládání stránek z jazyka do jazyka. "Kdybych tu byl před rokem, nemůžu zdaleka mluvit tak sebevědomě. Ale za rok, co je Google v Česku, uvedl jedenáct lokalizovaných služeb. Je to dobře, že jsme pronikli na tento trh, kde je deset milionů lidí a jedenáct milionů mobilních telefonů. Můžete mi někdo prozradit, co děláte s tím druhým mobilem. Voláte sami sobě?" ptal se dopoledne novinářů.

Český Google má podle něj dobře "našlápnuto".  Třeba bloggerů je na blogger.com z Česka víc než z Ruska. Taťána le Moigne slíbila, že se bude nadále snažit přitáhnout "více Googlu do Česka a více Čechů do Googlu."

 Populární vyhledávání v ČR - Douglas Merrill

Populární české dotazy na Google. "V každé zemi je to stejné - na prvním místě je nějaká hezká žena," komentoval to Douglas.

Na dotaz jednoho ze studentů Douglas připustil, že Google možná není jasnou jedničkou na českém trhu. "Jsme rádi, že máme konkurenci, která nás motivuje k lepším výsledkům."


Douglas MerrillDouglas Merrill

Vice President, Engineering, Google

Douglas Merrill do Googlu nastoupil v roce 2003 na pozici „Senior Director of Information Systems“. Vedl několik strategických akcí včetně vstupu Googlu na burzu v roce 2004 a s tím související činnosti. Nyní má přímo na starosti veškerý inženýring a vývoj. Je mu 37 let.



Douglas Merrill má za sebou několik zajímavých zkušeností: byl senior vicepresidentem v Charles Schwab and Co., Inc, nadnárodní společnosti poskytující finanční služby. Byl tu zodpovědný za takové funkce jako informační bezpečnost, infrastrukturu a personální strategii. Předtím pracoval jako senior manager v Price Waterhouse, kde sbíral zkušenosti v implementaci bezpečnostních politik. Pracoval také jako vědec-informatik v RAND Corporation, kde studoval témata jako počítačová simulace ve vzdělávání, dynamika týmu a efektivita organizace.

Douglas Merrill absolvoval bakalářské studium na Univerzitě v Tulse a titul magistra a Ph.D. z psychologie na Princetonské univerzitě.


Mobilní internet

"Co je na následujícím obrázku?" zeptal se Douglas, zatímco projektory promítaly černý obraz s bílými tečkami (podobný tomuto). "To je mapa vyhledávání," ozvalo se z lavice. "Jak jste to věděli?" zanaříkal naoko Douglas. "Obvykle lidi hádají, že je to Země v noci..." Na mapě vzniklé vizualizací lokalizovaných požadavků vyhledávání je dobře vidět, kde lidé po světě nejvíce hledají. Jasně svítí východní pobřeží USA, Evropa i Japonsko a západ Asie. "A kde je Afrika?" ptá se Douglas a hned odpovídá: do Afriky vedou jen dvě páteřní sítě a všechny přípojné body jsou velice drahé, často v rukou místní vlády.

Prezentace - Douglas Merrill

Řešení se nabízí v podobě mobilních telefonů - právě na ně se Google bude soustředit. Nestačí prý jen vzít desktopovou verzi vyhledávače a zmenšit ji, telefon vyžaduje jiný přístup. Má to i své výhody: "Telefon ví, kde jste, s kým se bavíte a jak dlouho, kde jste byli včera. Když to tak vezmete, telefon toho o vás ví víc než vaši rodiče."

Váš osobní vyhledávač

A to je další oblast, kterou Douglas Merrill prezentoval jako klíčovou: personalizované vyhledávání. "Když budu hledat slovo 'football', myslím tím něco jiného než Evropané. Google by to měl vědět. Lidé se nemají přizpůsobovat vyhledávači, ale vyhledávač lidem," zdůrazňuje doktor psychologie.

 Prezentace - Douglas Merrill

"Google se vám přizpůsobí," slibuje Doug. V pozadí vidíme (trochu vybělenou) stránku iGoogle, která je nyní dostupná i v češtině. Podle Taťány le Moigne se jedná o velice žádanou funkci.

První kroky tímto směrem Google již učinil. Uživatelé mohou prohledávat své minulé dotazy a tyto dotazy jsou používány pro zpřesnění výsledků. Také je možné si na homepage umístit různé gadgety (je jich kolem deseti tisíc) a i na jejich základě Google zpřesňuje výsledky vyhledávání.

Při našem soukromém rozhovoru mi později řekl, že toto považuje za velký úkol do budoucna - aby byl Google schopen odpovědět konkrétnímu uživateli na základě jeho jedinečných preferencí. Používání vyhledávače by mělo být podle něj tak snadné jako používání vlastní paměti. "Když si nemůžu vzpomenout na název písničky, soustředím se na nějaká slova..." "Přesně tak," potvrdil mi.

Až do našeho mozku?

"Indexujete knihy, videa, obrázky... Je něco, co by Google nikdy neindexoval, i kdyby mohl?" zeptal jsem se.

"Všechny informace na světě jsou univerzálně prohledávatelné. Všechny informace!" zopakoval rozhodně Doug jejich misi.

"A co třeba moje myšlenky? Kdybyste je mohli nějakým způsobem číst, zaindexovali byste je a umožnili prohledávat?"

"Ano, zaindexovali. Ale prohledávat byste je mohl jenom vy," vysvětluje Douglas a spekuluje: "Bohužel zatím myšlenky číst neumíme. Je to zajímavé... Já studoval psychologii a jeden ze způsobů, jakým si lidé věci pamatují, je, že si vytvářejí příběhy. Když se nám něco přihodí, vytváříme příběh, který tomu dá smysl. Takže když vzpomínáme, vlastně prohledáváme svoji paměť. Kdybych v tom mohl nějak pomoci [vyhledávací službou], tak proč ne?"

Na druhou stranu, v současné době například Google nepoužívá obsah e-mailů, které posíláte nebo přijímáte přes Gmail, k upřesnění výsledků vyhledávání.

Univerzální vyhledávání a řešené problémy

Nedávno Google spustil tzv. "Universal Search", spočívající v nabízení výsledků specializovaných vyhledávačů ve výsledcích "normálních". Mezi odkazy na stránky tak najdete obrázky, videa z YouTube nebo noviny. Ale v jakém by měly být pořadí? Co je důležitější, video, nebo novinka?

Prezentace - Douglas Merrill

Na tyto otázky Google zatím hledá odpověď. Stejně tak se hledají nové metody, jak indexovat a analyzovat obrázky. Google také řeší, zda je nutné, aby jejich vyhledávač rozuměl textu a chápal jeho význam, nebo zda stačí, aby se orientoval v syntaxi a o zbytek se postaraly matematické a statistické algoritmy, jako je tomu u Googlu dosud.

"Did I mention we're hiring?"

Přednáška na ČVUT nebyla jen akademická. Společnost Google se zde již podruhé prezentovala studentům i proto, že právě mladé lidi shánějí do svého týmu po celém světě. Otevřené jsou pozice vývojářů i prodejců. Speciální stipendium je nabízeno také dívkám.

 We are hiring - Douglas Merrill

"Pojďte k nám, je s námi zábava!" vybízel Douglas Merrill studenty.

Přednáška ČVUT - Douglas MerrillPřednáška ČVUT - Douglas MerrillPřed přednáškovou místností 209 - Douglas Merrill






Vize na 300 let

Eric Smidh prý plánuje strategii a cíle společnosti na více než sto let dopředu. Na devět let starou firmu to rozhodně nejsou skromné ambice. S rychlostí, s jakou se služby Google objevují na trhu (zatím je jich asi sto), je ale jasné, že Google je opravdu "jiná společnost".

Před devíti lety byl Google pouze vyhledávač. Přes všechny nabalené služby a dodané reklamy zůstává stále vyhledávačem, od kterého se konkurence učí. Jsme zvědaví, co nám Google naservíruje dalšího a do jaké míry to změní naše návyky a nakolik se tento vyhledávač přizpůsobí nám.

Odkazy: