Kam kráčejí vyhledávače?

Jeden z úspěšných českých projektů na poli vyhledávačů umožňuje od minulého týdne nalézat multimediální soubory. O tom, zda je to velký či malý krok, lze polemizovat. Jaký se však dá očekávat další vývoj v této oblasti?
Na celosvětovou počítačovou sít internet je nahlíženo především jako na nekonečnou zásobárnu dat, informací, dokumentů a souborů. Informace se zde však povalují bez ladu a skladu, a tak bohužel nelze tento zdroj využívat podobně jako knihovnu, kde má každá kniha své přesné místo a je označená podle mezinárodních pravidel. Nejrozšířenější možností, jak se ve té změti dat dostat k potřebné informaci, jsou vyhledávací stroje.

Vygooglovat

S trochou nadsázky by se dalo říci, že se svět vyhledávačů se dělí na dobu před Googlem a po Googlu. Tento vyhledávací systém vznikl v roce 1998 jako dílko dvou stanfordských studentů. Jeho denní provoz se na konci prvního roku provozu pohyboval kolem 10 000 dotazů. O rok později to již bylo 3 000 000 požadavků denně a v současné době je provoz vyšší než 200 000 000 dotazů/den.

Existuje mnoho důvodů, proč si lidé a vzápětí i firmy tento fulltextový vyhledávací stroj oblíbili. Jedním z nich je až neuvěřitelně velké množství dokumentů, se kterými systém pracuje. V současné době se jejich počet blíží 3 308 000 000. Dalším důvodem je patrně i skutečnost, že Google přinášel vždy něco nového. Jako příklad může sloužit schopnost vyhledávat soubory i jiných typů, než umožňovaly konkurenční známé systémy. V neposlední řadě je potřeba zmínit i jednoduchost ovládání, které neodradí ani méně zkušeného dolovače dat. Vše by to ale bylo na nic, kdyby systém Googlu zaostával v té hlavní funkci, tj. schopnostech vyhledat požadovanou informaci a posoudit její relevantnost.

O tom, že je Google úspěšný, svědčí i to, že v anglicky mluvících zemích se vžilo sloveso „to google“ pro vyhledávání. I v ČR se můžete setkat s výrazem „vygooglovat informaci“.

Úspěch Googlu nedá spát mnohým. Zatímco před několika lety se tento vyhledávací systém usadil na mnohých portálech, nyní tyto firmy pokukují po vlastním řešení. Do boje se chystá například vstoupit i Microsoft.

Jak se daří vyhledávačům v Česku?

Každý ze tří největších portálů v doméně .cz využívá jiný vyhledávací systém. Největší Seznam pracuje s Googlem. Centrum má vlastní systém Morfeo a Atlas využívá český vyhledávací stroj Jyxo.

Právě poslední zmíněný systém Jyxo na sebe upozorňuje čím dále tím více. Prvním významným oceněním byl Zavináč 2002 (výroční cena českého Internetu). Toho Jyxo získalo v kategorii Nejlepší nový projekt. Nyní na sebe Jyxo upozornilo dalším počinem. Tím je schopnost nechat vyhledávat pouze multimediální soubory. Systém dokáže z takových souborů získat přidružená textová metadata (například v podobě ID3 tagů) a v nich následně použít svůj vyhledávací systém. Tyto soubory ve formátech, jako je MPEG-1,2,4, Real Video, Windows Media, AVI apod., se musejí nacházet na některé webové stránce.

Podle Michala Illicha, který za Jyxem stojí, trval vývoj celého systému přibližně sedm měsíců. O tom, jak se práce zdařila, se můžete přesvědčit na stránce Jyxo.cz.

A jak vidí Illich další vývoj svého dítěte? „Budoucnost Jyxa vidím v zlepšení schopnosti porozumět lidskému jazyku - aby vyhledávač nejen hledal "slova", ale skutečně porozuměl smyslu uživatelského dotazu a našel odpověď.“ Porozumět češtině již do značné míry vyhledávač umí (skloňování a časování slov, synonyma, syntaktický rozbor) a autoři hodlají ve zlepšování ještě pokračovat.

Co čeká vyhledávače?

Původní systémy, které pouze prohledávaly textový obsah internetu, jsou již spíše zapomenuty. V nabídce je mnoho dalších funkcí, které mají uživatelům usnadnit přístup k požadovaným datům. Za příklad si můžeme znovu vzít Google. Ten vedle hlavní vyhledávací nabídky umožňuje využít zhruba 15 dalších služeb, z nichž jsou ale některé ve zkušebním provozu.

Mezi ty nejzajímavější rozhodně patří možnost nechat si strojově přeložit cizojazyčnou stránku do angličtiny. Dále zaujme nabídka prohlížet si aktuální zpravodajství ze zhruba 4 500 zpravodajských webů nebo služba, kde na položený dotaz za poplatek odpoví odborníci k tomu určení. V testovací fázi je zase nástroj s názvem Froogle, který umožňuje vyhledávat v nabídce produktů různých obchodů a porovnávat jejich ceny. Zároveň má uživatel šanci přečíst si například recenzi zobrazeného produktu. Další testované služby naleznete na adrese labs.google.com

Velkou výzvou pro vyhledávače je oblast nazývaná mnohdy jako „neviditelný web“. To jsou většinou data, která se nacházejí v souborech, s nimiž se doposud vyhledávače nenaučily pracovat. Jsou to také informace, které jsou dostupné pouze po vyplnění nějakého formuláře, nebo na základě přihlášení. Jak je ale vidět i na příkladě českého Jyxa, začíná se oblast „neviditelného webu“ zmenšovat“.

  • Nejčtenější

Kam pro filmy bez Ulož.to? Přinášíme další várku streamovacích služeb do TV

v diskusi je 125 příspěvků

26. března 2024

S vhodnou aplikací na vás mohou v televizoru na stisk tlačítka čekat tisíce filmů, seriálů nebo...

Z jaderné triády zbyly Britům už jen ponorky. A ty musejí posílit

v diskusi je 76 příspěvků

27. března 2024

Jadernou triádu tvoří strategické bombardéry s jadernými zbraněmi, mezikontinentální balistické...

{NADPIS reklamního článku dlouhý přes dva řádky}

{POPISEK reklamního článku, také dlouhý přes dva a možná dokonce až tři řádky, končící na tři tečky...}

Hlučínsko patří nám. Před 100 lety byl podepsán definitivní protokol o hranici

v diskusi je 41 příspěvků

28. března 2024

Před 100 lety definitivně skončily tahanice o československo-německé hranice. 28. března 1924 byl...

Rusko zastavilo odlet na ISS s první Běloruskou, letět měla i Američanka

v diskusi je 50 příspěvků

21. března 2024  10:23,  aktualizováno  14:26

Ve čtvrtek 21. března se necelých deset minut před půl třetí odpoledne měla vydat na Mezinárodní...

{NADPIS reklamního článku dlouhý přes dva řádky}

{POPISEK reklamního článku, také dlouhý přes dva a možná dokonce až tři řádky, končící na tři tečky...}

Načapali jsme otesánka, který se velkého sousta nezalekne. Boeing 747-400F

v diskusi je 8 příspěvků

21. března 2024

Poté, co na Letiště Václava Havla Praha přestaly v barvách Qatar Airways létat nákladní Boeingy...

Dočasná raketa se po téměř 70 letech loučí. Bude startovat naposledy

v diskusi jsou 4 příspěvky

28. března 2024  15:36,  aktualizováno  19:54

Tento čtvrtek stojí na startovací rampě mysu Canaveral poslední potomek raket Thor, nosič Delta IV...

Američané odepsali modul, který je vrátil po půl století na Měsíc

v diskusi je 20 příspěvků

28. března 2024,  aktualizováno  11:41

Od začátku letošního roku je na Měsíci a kolem něj poměrně rušno. Vedle řady sond, které zamířily...

Hlučínsko patří nám. Před 100 lety byl podepsán definitivní protokol o hranici

v diskusi je 41 příspěvků

28. března 2024

Před 100 lety definitivně skončily tahanice o československo-německé hranice. 28. března 1924 byl...

Úspěšný let prototypu XB-1 vrací do hry cestování nadzvukovou rychlostí

v diskusi je 34 příspěvků

27. března 2024  17:17

Po více než dvaceti letech, od ukončení provozu letounu Concorde, se možná opět dočkáme nadzvukové...

Rána pro britskou monarchii. Princezna Kate má rakovinu, chodí na chemoterapii

Britská princezna z Walesu Kate (42) se léčí s rakovinou. Oznámila to sama ve videu na sociálních sítích poté, co se...

Smoljak nechtěl Sobotu v Jáchymovi. Zničil jsi nám film, řekl mu

Příběh naivního vesnického mladíka Františka, který získá v Praze díky kondiciogramu nejen pracovní místo, ale i...

Rejžo, jdu do naha! Balzerová vzpomínala na nahou scénu v Zlatých úhořích

Eliška Balzerová (74) v 7 pádech Honzy Dědka přiznala, že dodnes neví, ve který den se narodila. Kromě toho, že...

Pliveme vám do piva. Centrum Málagy zaplavily nenávistné vzkazy turistům

Mezi turisticky oblíbené destinace se dlouhá léta řadí i španělská Málaga. Přístavní město na jihu země láká na...

Kam pro filmy bez Ulož.to? Přinášíme další várku streamovacích služeb do TV

S vhodnou aplikací na vás mohou v televizoru na stisk tlačítka čekat tisíce filmů, seriálů nebo divadelních...