Klávesové zkratky na tomto webu - základní­
Přeskočit hlavičku portálu


Google: stránku najdete pár sekund po jejím zaindexování, a dvakrát rychleji

Exkluzivně aktualizováno 
Nový index jménem Caffeine umožňuje okamžité přidávání stránek do databáze Google nebo rychlejší vyhledávání. A časem třeba i silnou personalizaci výsledků podle toho, co se líbí vašim přátelům. Řazení stránek se zatím nemění, řekl Technetu exkluzivně Matt Cutts z oddělení Search Quality.

Nový systém Caffeine nabízí prakticky okamžité přidávání stránek do indexu Google, zajišťuje vyšší rychlost a škálovatelnost | foto: Google

"Jsme tady v Googlu z Caffeinu nadšení," ujišťuje mne Matt Cutts hned v úvodu našeho rozhovoru. A Caffeinem nemá na mysli pravidelný přísun kávy. Jde o jméno nového systému pro indexování webu, které má evokovat rychlost a čerstvost - právě to mají totiž být jeho hlavní přednosti. "Caffeine je dělaný pro web, kde jsou vedle sebe text, obrázky, videa, sociální sítě nebo lokální obsah."

Kdykoli zadáte něco do vyhledávače Google, neprohledáváte ve skutečnosti web jako takový, ale prohledávate tzv. index - kopii webu, kterou má Google na svých serverech. Zaindexované stránky jsou nejen uloženy, ale také předem připraveny a setřízeny pro rychlejší řazení. Díky tomu můžete získat i na obtížné dotazy odpověď do několika desetin sekundy. "Když jsem roku 2000 u firmy Google začínal, obnovoval se index jednou za čtyři měsíce. Naším cílem byl tehdy měsíc," vzpomíná Cutts. "Dnes nám to přijde neuvěřitelné, ale tehdy to byla velká rychlost. Ale po 11. září v roce 2001 a prezidentských volbách 2004 bylo jasné, že lidé požadují rychlejší aktualizaci."

O deset let později už Google nabízel každodenní aktualizaci, přičemž každých asi deset dní prošly jeho crawlery celý dostupný web. Stále ale bylo nutné uložené kopie stránek indexovat, každé datacentrum tedy muselo čas od času obnovit a přestavět svůj index.

Autobusem či taxikem?

"Je to jako když čekáte na zastávce na autobus. Možná jezdí jednou za hodinu, možná jednou za deset minut, ale vždycky musíte čekat," připodobňuje Cutts změněné stránky k cestujícím. "A Caffeine umožňuje, aby pro každého z těch cestujících přijel taxik hned ve chvíli, kdy přijde na zastávku." Stručně řečeno - stránka může být do indexu přidána okamžitě poté, co ji crawler najde. "Úplně jsme přepsali indexovací algoritmy, a výsledkem je, že nabízíme o 50 % čerstvější výsledky. To je myslím velká změna."

Co nového v Caffeine?

Většina změn je "pod kapotou" a běžný uživatel je možná pocítí jen nepatrně (na vyšší rychlosti nebo čerstvosti výsledků), pro Google je ale prý Caffeine důležitý i z dalších důvodů: škálovatelnosti a univerzálnosti.

1. okamžité přidání stránky do indexu - stránky již nemusejí čekat na přeindexování a jsou uživatelům k dispozici "i pár sekund poté, co je náš crawler najde"

2. čerstvé výsledky jsou přímým důsledkem okamžitého přidání

3. škálovatelnost - velikost indexu narůstá tempem statisíců gigabajtů za den, a podle Matta Cuttse je Caffeine tomuto tempu lépe přizpůsoben

4. lepší práce s meta daty - do budoucna možná nejvýznamnějším aspektem bude lepší práce s metadaty nového indexu: "Pokud je na stránce fracouzština i němčina, vyhledávač to pozná a k těmto částem bude přistupovat různě. Pokud bude na stránce obrázek a my rozpoznáme, co na něm je, bude to hrát roli pro další kritérie a řazení výsledků..."

Když jsem se ale zeptal, zda se mění i algoritmus pro řazení výsledků (jak to naznačovalo třeba Mashable), odpověděl Matt jasně: "Zatím to na řazení výsledků nemá žádný vliv, jde pouze o rychlost indexování. V Mashable se asi nechali nakazit naším nadšením a spekulovali."

Do budoucna nicméně Caffeine mnohé zajímavé změny umožní: "Dokážeme třeba v reálném čase sledovat, které stránky jsou zrovna oblíbené, tedy odkazované, na Twitteru nebo Facebooku. A když třeba budete hledat něco, o čem nedávno tweetoval někdo z vašich přátel, tak to jím odkazované stránce pomůže ve výsledcích nahoru," popsal i jeden z možných modelů individualizace výsledků vyhledávání.

A ovlivní Caffeine nejvýznamnější příjmový kanál Google, tedy reklamu? "S reklamami tato změna nijak nesouvisí," řekl mi Cutts. "Klademe velký důraz na to, aby bylo vyhledávání od reklam oddělené, a to jako pro uživatele, tak z hlediska vnitřních struktur." Celkově se tak změna tvůrců obsahu zatím nedotkne, jen uvidí své stránky ve výsledcích až o polovinu dříve.

"Nesrovnáváme se s konkurencí," zopakoval Cutts to, co nám již dříve řekl Nelson Mattos. "Místo toho se snažíme vyvinout lepší vyhledávač pro uživatele. Caffein je tak podle Matta Cuttse především důležitým krokem do budoucna.

Další zdroje:

Autor:




Hlavní zprávy

Další z rubriky

VPN v ohrožení
Apple stáhl z Číny aplikace s VPN. Putin podepsal jejich zákaz v Rusku

Blokování přístupu na necenzurovaný internet je v některých zemích stále populárnější. Kvůli požadavkům čínských úřadů tak Apple stahuje VPN aplikace. V Rusku...  celý článek

(Ilustrační snímek)
Upozornil MHD na ostudnou chybu. Maďarská policie ho zatkla jako „hackera“

Maďarský provozovatel hromadné dopravy v Budapešti zavedl nový systém pro placení lístků on-line. Narychlo spuštěné stránky však obsahovaly řadu zásadních...  celý článek

Sídlo společnosti Google v Mountain View v Kalifornii (ilustrační snímek)
Google propustil programátora kvůli traktátu proti podpoře žen v IT

Programátor James Damore kritizoval ve svém dokumentu politickou korektnost a „levicové zkreslení“ společnosti Google. Vystoupil především proti tomu, aby se...  celý článek

Akční letáky
Akční letáky

Prohlédněte si akční letáky všech obchodů hezky na jednom místě!

Najdete na iDNES.cz



mobilní verze
© 1999–2017 MAFRA, a. s., a dodavatelé Profimedia, Reuters, ČTK, AP. Jakékoliv užití obsahu včetně převzetí, šíření či dalšího zpřístupňování článků a fotografií je bez souhlasu MAFRA, a. s., zakázáno. Provozovatelem serveru iDNES.cz je MAFRA, a. s., se sídlem
Karla Engliše 519/11, 150 00 Praha 5, IČ: 45313351, zapsaná v obchodním rejstříku vedeném Městským soudem v Praze, oddíl B, vložka 1328. Vydavatelství MAFRA, a. s., je členem koncernu AGROFERT.