Klávesové zkratky na tomto webu - základní­
Přeskočit hlavičku portálu


Kam kráčejí vyhledávače?

aktualizováno 
Jeden z úspěšných českých projektů na poli vyhledávačů umožňuje od minulého týdne nalézat multimediální soubory. O tom, zda je to velký či malý krok, lze polemizovat. Jaký se však dá očekávat další vývoj v této oblasti?
Na celosvětovou počítačovou sít internet je nahlíženo především jako na nekonečnou zásobárnu dat, informací, dokumentů a souborů. Informace se zde však povalují bez ladu a skladu, a tak bohužel nelze tento zdroj využívat podobně jako knihovnu, kde má každá kniha své přesné místo a je označená podle mezinárodních pravidel. Nejrozšířenější možností, jak se ve té změti dat dostat k potřebné informaci, jsou vyhledávací stroje.

Vygooglovat

S trochou nadsázky by se dalo říci, že se svět vyhledávačů se dělí na dobu před Googlem a po Googlu. Tento vyhledávací systém vznikl v roce 1998 jako dílko dvou stanfordských studentů. Jeho denní provoz se na konci prvního roku provozu pohyboval kolem 10 000 dotazů. O rok později to již bylo 3 000 000 požadavků denně a v současné době je provoz vyšší než 200 000 000 dotazů/den.

Existuje mnoho důvodů, proč si lidé a vzápětí i firmy tento fulltextový vyhledávací stroj oblíbili. Jedním z nich je až neuvěřitelně velké množství dokumentů, se kterými systém pracuje. V současné době se jejich počet blíží 3 308 000 000. Dalším důvodem je patrně i skutečnost, že Google přinášel vždy něco nového. Jako příklad může sloužit schopnost vyhledávat soubory i jiných typů, než umožňovaly konkurenční známé systémy. V neposlední řadě je potřeba zmínit i jednoduchost ovládání, které neodradí ani méně zkušeného dolovače dat. Vše by to ale bylo na nic, kdyby systém Googlu zaostával v té hlavní funkci, tj. schopnostech vyhledat požadovanou informaci a posoudit její relevantnost.

O tom, že je Google úspěšný, svědčí i to, že v anglicky mluvících zemích se vžilo sloveso „to google“ pro vyhledávání. I v ČR se můžete setkat s výrazem „vygooglovat informaci“.

Úspěch Googlu nedá spát mnohým. Zatímco před několika lety se tento vyhledávací systém usadil na mnohých portálech, nyní tyto firmy pokukují po vlastním řešení. Do boje se chystá například vstoupit i Microsoft.

Jak se daří vyhledávačům v Česku?

Každý ze tří největších portálů v doméně .cz využívá jiný vyhledávací systém. Největší Seznam pracuje s Googlem. Centrum má vlastní systém Morfeo a Atlas využívá český vyhledávací stroj Jyxo.

Právě poslední zmíněný systém Jyxo na sebe upozorňuje čím dále tím více. Prvním významným oceněním byl Zavináč 2002 (výroční cena českého Internetu). Toho Jyxo získalo v kategorii Nejlepší nový projekt. Nyní na sebe Jyxo upozornilo dalším počinem. Tím je schopnost nechat vyhledávat pouze multimediální soubory. Systém dokáže z takových souborů získat přidružená textová metadata (například v podobě ID3 tagů) a v nich následně použít svůj vyhledávací systém. Tyto soubory ve formátech, jako je MPEG-1,2,4, Real Video, Windows Media, AVI apod., se musejí nacházet na některé webové stránce.

Podle Michala Illicha, který za Jyxem stojí, trval vývoj celého systému přibližně sedm měsíců. O tom, jak se práce zdařila, se můžete přesvědčit na stránce Jyxo.cz.

A jak vidí Illich další vývoj svého dítěte? „Budoucnost Jyxa vidím v zlepšení schopnosti porozumět lidskému jazyku - aby vyhledávač nejen hledal "slova", ale skutečně porozuměl smyslu uživatelského dotazu a našel odpověď.“ Porozumět češtině již do značné míry vyhledávač umí (skloňování a časování slov, synonyma, syntaktický rozbor) a autoři hodlají ve zlepšování ještě pokračovat.

Co čeká vyhledávače?

Původní systémy, které pouze prohledávaly textový obsah internetu, jsou již spíše zapomenuty. V nabídce je mnoho dalších funkcí, které mají uživatelům usnadnit přístup k požadovaným datům. Za příklad si můžeme znovu vzít Google. Ten vedle hlavní vyhledávací nabídky umožňuje využít zhruba 15 dalších služeb, z nichž jsou ale některé ve zkušebním provozu.

Mezi ty nejzajímavější rozhodně patří možnost nechat si strojově přeložit cizojazyčnou stránku do angličtiny. Dále zaujme nabídka prohlížet si aktuální zpravodajství ze zhruba 4 500 zpravodajských webů nebo služba, kde na položený dotaz za poplatek odpoví odborníci k tomu určení. V testovací fázi je zase nástroj s názvem Froogle, který umožňuje vyhledávat v nabídce produktů různých obchodů a porovnávat jejich ceny. Zároveň má uživatel šanci přečíst si například recenzi zobrazeného produktu. Další testované služby naleznete na adrese labs.google.com

Velkou výzvou pro vyhledávače je oblast nazývaná mnohdy jako „neviditelný web“. To jsou většinou data, která se nacházejí v souborech, s nimiž se doposud vyhledávače nenaučily pracovat. Jsou to také informace, které jsou dostupné pouze po vyplnění nějakého formuláře, nebo na základě přihlášení. Jak je ale vidět i na příkladě českého Jyxa, začíná se oblast „neviditelného webu“ zmenšovat“.





Hlavní zprávy

Další z rubriky

Chraňte včas své elektronické zařízení.
Chraňte svůj tablet před viry a hackery a za odměnu si zahrajte

Bezpečnostní rizika dnes číhají i na majitele mobilních zařízení, takže jsme do dnešního přehledu zařadili i antivirovou aplikaci, která se postará i o ochranu...  celý článek

Notebook
Stáhněte si zdarma: Vdechněte právě pořízeným fotografiím retro vzhled

Jako kdyby byly pořízeny Polaroidem a před dávnou dobou. Přitom jsou to fotografie zcela nové. Chcete-li i vy takové vytvářet, použijte program XnRetro....  celý článek

Ilustrační foto
Uložte si obsah obrazovky na později či pro kamaráda

Zapomeňte na klávesu Print Screen, screenshoty se dnes pořizují zcela jinak – snadněji, automaticky a to třeba včetně celé webové stránky. Perličkou je možnost...  celý článek

Najdete na iDNES.cz



mobilní verze
© 1999–2017 MAFRA, a. s., a dodavatelé Profimedia, Reuters, ČTK, AP. Jakékoliv užití obsahu včetně převzetí, šíření či dalšího zpřístupňování článků a fotografií je bez souhlasu MAFRA, a. s., zakázáno. Provozovatelem serveru iDNES.cz je MAFRA, a. s., se sídlem
Karla Engliše 519/11, 150 00 Praha 5, IČ: 45313351, zapsaná v obchodním rejstříku vedeném Městským soudem v Praze, oddíl B, vložka 1328. Vydavatelství MAFRA, a. s., je členem koncernu AGROFERT.