Vyhledávač Yahoo! se pokouší proniknout do „neviditelného“ webu

  • 1
Portál Yahoo! se nedávno rozloučil s dlouhodobě využívaným vyhledávacím systémem Google. Nahradil jej vlastní technologií, jejíž schopnosti a vlastnosti postupně rozšiřuje. Nyní se hodlá zaměřit na oblast tzv. „neviditelného webu“.
V portále Yahoo!, který provozuje stejnojmenná firma, byl nedávno nahrazen vyhledávací systém Google vlastním řešením. Není se co divit - příjmy, které v důsledku nasazení externí technologie společnosti unikaly, nebyly zanedbatelné. Jako příklad může sloužit majetek dvou zakladatelů firmy Googlu, který se u každého z nich tento rok přehoupl přes jednu miliardu amerických dolarů.

Důvod, proč se Yahoo! zbavil původního vyhledávače, je tedy zřejmý. Odchod Googlu znamenal nasazení dlouho testovaného systému z vlastní dílny. K tomu, aby uživatele přesvědčil, že mají využívat právě vyhledávací systém Yahoo!, však nestačí pouze známé jméno. Ví to samozřejmě i lidé z této firmy, kteří nyní oznámili, že Yahoo! chystá průnik na neprobádané pole tzv. neviditelného webu.

Nedosažitelné zdroje

Ačkoliv světové vyhledávače dokáží pracovat se stovkami miliónů stránek, zůstává před zraky uživatelů, kteří tyto vyhledávače používají, skryto obrovské množství dalších dat. Informace na takových webech jsou totiž buď ve formátu, který není vyhledávači podporován, případně se k nim lze dostat přes speciální rozhraní nebo stránky, které nelze těmito vyhledávači prohlížet

Avšak právě s takovými informacemi se nyní chystá pracovat vyhledávací systém Yahoo! Search. Pomoci k tomu má připravený systém Content Acquision Program (CAP), jehož pomocí může být indexováno, a tím pádem využito pro vyhledávání, obrovské množství doposud dokumentů. Ty se prozatím ukrývaly ve veřejně přístupných databázích, kde k nim byl možný přístup pouze přes specializované rozhraní. Samotné dokumenty nemohly být doposud vyhledávači využívány, neboť nebyly přímo dostupné.

Nově tak má uživatel možnost nechat vyhledávací stroj bloudit v knihovně Amerického kongresu, Kalifornské či Michiganské univerzity. Další nově otevřený prostor pro prohledávání se otevřel v audiodatabázích National Public Radio (NPC), či v projektu Guttenberg, který se zabývá převodem knih do elektronické podoby.

Yahoo! počítá s tím, že se mu díky průniku do neprobádaných vod webu podaří zvýšit počet indexovaných dokumentů až na 100 miliard.

Nic není zadarmo

Do systému CAP firma Yahoo! přidala technologii Site Match. Ta je určena pro ty poskytovatele obsahu, kteří chtějí své stránky rychleji a přednostně indexovat a tím pádem získat lepší pozici ve vyhledaných odkazech. Také tak mají zaručeno, že systém bude vyhledávat v co nejaktuálnějších údajích. Site Match ale není zadarmo. Roční poplatek za jednu webovou adresu činí 49 USD a za každou další pak 29 USD. Od desáté zaregistrované adresy se poplatek snižuje na 10 amerických dolarů. Další peníze pak budou Yahoo! plynout z případného kliku uživatele na vyhledaný odkaz. Cena se v tomto případě pohybuje mezi 15 až 30 centy za jeden klik.

„Výsledky vyhledávání jsou z 99 % získány z finančně neupřednostňovaných stránek a pouhé 1 % pak pochází z některého z placených programů,“ uvedl pro server News.com Tom Cadogan, který ve firmě vede divizi vyhledávače.

Zvítězí komerce?

Ačkoliv lze Yahoo! za Cap pochválit, Site Match možná způsobí bolení hlavy nejednomu uživateli. Doposud byly sponzorované linky u hlavních vyhledávacích systémů opticky odděleny. Tyto odkazy však nyní Yahoo! začlení přímo do vyhledaných odkazů. Cadogan sice tvrdí, že je vyhledávací systém dostatečně ochráněn proti tomu, aby dával přednost méně relevantním odkazům, ale jak to nakonec dopadne, ukáže jen čas.