Nový systém Caffeine nabízí prakticky okamžité přidávání stránek do indexu Google, zajišťuje vyšší rychlost a škálovatelnost

Nový systém Caffeine nabízí prakticky okamžité přidávání stránek do indexu Google, zajišťuje vyšší rychlost a škálovatelnost | foto: Google

Google: stránku najdete pár sekund po jejím zaindexování, a dvakrát rychleji

  • 42
Nový index jménem Caffeine umožňuje okamžité přidávání stránek do databáze Google nebo rychlejší vyhledávání. A časem třeba i silnou personalizaci výsledků podle toho, co se líbí vašim přátelům. Řazení stránek se zatím nemění, řekl Technetu exkluzivně Matt Cutts z oddělení Search Quality.

"Jsme tady v Googlu z Caffeinu nadšení," ujišťuje mne Matt Cutts hned v úvodu našeho rozhovoru. A Caffeinem nemá na mysli pravidelný přísun kávy. Jde o jméno nového systému pro indexování webu, které má evokovat rychlost a čerstvost - právě to mají totiž být jeho hlavní přednosti. "Caffeine je dělaný pro web, kde jsou vedle sebe text, obrázky, videa, sociální sítě nebo lokální obsah."

Kdykoli zadáte něco do vyhledávače Google, neprohledáváte ve skutečnosti web jako takový, ale prohledávate tzv. index - kopii webu, kterou má Google na svých serverech. Zaindexované stránky jsou nejen uloženy, ale také předem připraveny a setřízeny pro rychlejší řazení. Díky tomu můžete získat i na obtížné dotazy odpověď do několika desetin sekundy. "Když jsem roku 2000 u firmy Google začínal, obnovoval se index jednou za čtyři měsíce. Naším cílem byl tehdy měsíc," vzpomíná Cutts. "Dnes nám to přijde neuvěřitelné, ale tehdy to byla velká rychlost. Ale po 11. září v roce 2001 a prezidentských volbách 2004 bylo jasné, že lidé požadují rychlejší aktualizaci."

O deset let později už Google nabízel každodenní aktualizaci, přičemž každých asi deset dní prošly jeho crawlery celý dostupný web. Stále ale bylo nutné uložené kopie stránek indexovat, každé datacentrum tedy muselo čas od času obnovit a přestavět svůj index.

Autobusem či taxikem?

"Je to jako když čekáte na zastávce na autobus. Možná jezdí jednou za hodinu, možná jednou za deset minut, ale vždycky musíte čekat," připodobňuje Cutts změněné stránky k cestujícím. "A Caffeine umožňuje, aby pro každého z těch cestujících přijel taxik hned ve chvíli, kdy přijde na zastávku." Stručně řečeno - stránka může být do indexu přidána okamžitě poté, co ji crawler najde. "Úplně jsme přepsali indexovací algoritmy, a výsledkem je, že nabízíme o 50 % čerstvější výsledky. To je myslím velká změna."

Co nového v Caffeine?

Většina změn je "pod kapotou" a běžný uživatel je možná pocítí jen nepatrně (na vyšší rychlosti nebo čerstvosti výsledků), pro Google je ale prý Caffeine důležitý i z dalších důvodů: škálovatelnosti a univerzálnosti.

1. okamžité přidání stránky do indexu - stránky již nemusejí čekat na přeindexování a jsou uživatelům k dispozici "i pár sekund poté, co je náš crawler najde"

2. čerstvé výsledky jsou přímým důsledkem okamžitého přidání

3. škálovatelnost - velikost indexu narůstá tempem statisíců gigabajtů za den, a podle Matta Cuttse je Caffeine tomuto tempu lépe přizpůsoben

4. lepší práce s meta daty - do budoucna možná nejvýznamnějším aspektem bude lepší práce s metadaty nového indexu: "Pokud je na stránce fracouzština i němčina, vyhledávač to pozná a k těmto částem bude přistupovat různě. Pokud bude na stránce obrázek a my rozpoznáme, co na něm je, bude to hrát roli pro další kritérie a řazení výsledků..."

Když jsem se ale zeptal, zda se mění i algoritmus pro řazení výsledků (jak to naznačovalo třeba Mashable), odpověděl Matt jasně: "Zatím to na řazení výsledků nemá žádný vliv, jde pouze o rychlost indexování. V Mashable se asi nechali nakazit naším nadšením a spekulovali."

Do budoucna nicméně Caffeine mnohé zajímavé změny umožní: "Dokážeme třeba v reálném čase sledovat, které stránky jsou zrovna oblíbené, tedy odkazované, na Twitteru nebo Facebooku. A když třeba budete hledat něco, o čem nedávno tweetoval někdo z vašich přátel, tak to jím odkazované stránce pomůže ve výsledcích nahoru," popsal i jeden z možných modelů individualizace výsledků vyhledávání.

A ovlivní Caffeine nejvýznamnější příjmový kanál Google, tedy reklamu? "S reklamami tato změna nijak nesouvisí," řekl mi Cutts. "Klademe velký důraz na to, aby bylo vyhledávání od reklam oddělené, a to jako pro uživatele, tak z hlediska vnitřních struktur." Celkově se tak změna tvůrců obsahu zatím nedotkne, jen uvidí své stránky ve výsledcích až o polovinu dříve.

"Nesrovnáváme se s konkurencí," zopakoval Cutts to, co nám již dříve řekl Nelson Mattos. "Místo toho se snažíme vyvinout lepší vyhledávač pro uživatele. Caffein je tak podle Matta Cuttse především důležitým krokem do budoucna.

Další zdroje: