Premium

Získejte všechny články mimořádně
jen za 49 Kč/3 měsíce

Zklamání od Wikipedie: vyhledávač řízený lidmi je zatím v plenkách

Wikia Search od Jimmyho Walese, zakladatele oblíbené encyklopedie Wikipedia.org, přišla na internet s ambiciózními cíli. První verze ale uživatele zklamala - výsledky nejsou relevantní, nezvládá diakritiku a dokonce ani příliš neodkazuje na Wikipedii. Kde je chyba?

Wikia.com provozuje kromě vyhledávače také stovky nejrůznějších wiki-stránek | foto: Pavel Kasík - Technet.cz

Wikipedia.org, otevřená encyklopedie, kterou může kdokoli editovat, patří již několik let k zářným příkladům fungujícího projektu. Překonala pomalé a zdlouhavé začátky a stala se jednou z deseti nejnavštěvovanějších stránek. V jistém smyslu zcela změnila náhled na uživateli generovaný obsah, a přes kritiku (např. za zneužitelnost nebo pro nedostatečné citování zdrojů) patří Wikipedia.org k pozitivně hodnoceným projektům.

popisek Více o historii Wikipedia.org
Objevte odpověď na většinu otázek na Wikipedii

Jimmy Wales, její zakladatel, se rozhodl své štěstí vyzkoušet i v oblasti vyhledávačů. Internetové vyhledávání je stále využívanější službou a dá se předpokládat, že s nárůstem dat na internetu bude jeho úloha jedině podstatnější. Odvětví vyhledávačů dominuje velká trojka: Google, Yahoo a MSN (nově Live.com). Když tedy Jimmy Wales o Vánocích 2006 oznámil, že jeho společnost Wikia přijde s vlastním vyhledávačem, jehož cílem je této trojce konkurovat, vyvolalo to ohlas a velká očekávání.

Veřejná alfa verze

7. ledna 2008 se Wikia Search konečně ukázal veřejnosti. Už od loňských Vánoc se na technologii těšili technologičtí nadšenci z celého světa. Potenciál lidské síly Wikipedie a strojové analýzy webu se skutečně nezdá zanedbatelný. Jak to tedy vypadá?

 Wikia.com - Homepage

Vyhledávání nenajdete na www.wikia.com ...

 Wikia.com - Alpha Search

... ale na stránkách http://alpha.search.wikia.com

Minimalistický design, na kterém je těžko co hodnotit. Nedočkavě zadáme slovo k vyhledávání a čekáme, jaké změny a vymoženosti na nás "lidmi řízené open-source vyhledávání" přichystá.

 Wikia.com - Prague

Vyhledávání slova "Prague"

A je tu první zklamání. Tam, kde klasické vyhledávače nabídnou odkaz na oficiální stránky města Praha nebo na Pražskou informační službu, jsou na Wikii (při defaultním nastavení) samé komerční stránky, jejichž informační hodnota je zanedbatelná. První použitelný výsledek jsem našel až na dvacáté pozici.

Co mě asi nejvíce zarazilo, je, že na Google.com i Live.com figuruje na vyhledávací slovo na prvním místě odkaz na heslo Prague v anglické Wikipedii.org. Na tento dotaz to spolu s výše zmíněnými oficiálními stránkami považuji za naprosto relevantní výsledek. Proč, ptám se, nezobrazuje Wikia.com výsledek ze "svojí" Wikipedie výše? Kdyby výše, on není ani v první stovce výsledků.

Open-source komunitní vyhledávač

Podobně se ptají recenzenti z technickým magazínů po celém světě. Je to pochopitelné, mnoho uživatelů je zklamaných kvalitou vyhledávání na Wikipedii.org (často je lepší prohledávat Wikipedii pomocí jiného vyhledávače) a doufali, že Wikia přinese přinejmenším kvalitní prohledávání Wikipedie.org.

Ambice vyhledávače Wikia jsou však větší a proto se nejspíš nechce na Wikipedii vázat. Prvek, který se ale Wikipedií inspiroval, je tzv. "Mini Article about" (mini článek o) na začátku vyhledávání. Pokud někdo hledal přesně to samé, co vy, mohl takový článek vytvořit nebo upravit. Editace probíhá prakticky stejně, jako na Wikipedii.

 Wikia.com - Barack Obama

Vyhledávání demokratického kandidáta, který už svůj Mini Article má. Obsahuje velmi stručné informace...

 Wikia.com - Barack Obama nové
... stačil ale den, aby se článek rozšířil o aktuální výsledky a fotku.
 Wikia.com - Spam

Editace je podobná té na Wikipedii. Vtipné je varování před spamem: "

Tvorba miničlánku je opravdu snadná, zvláště, pokud máte nějaké zkušenosti z Wikipedie. Pak je skutečně možné, že člověk denně napíše i desítky takovýchto miničlánků.

Nápad s Mini Article je ve skutečnosti výborný a může mnohé usnadnit, u vysoce specifických dotazů (jakých je obrovské množství. Jak uvádí viceprezident Google, pětina až čtvrtina všech dotazů denně jsou dotazy naprosto nové. V těch Mini Article vůbec nepomůže.

Další, zatím nefunkční funkce, umožňuje hvězdičkami ocenit jednotlivé výsledky. Zatím je tato funkce v testovacím provozu a výsledky se nikam neukládají. Podle mého je to špatný tah - nadšence to pouze odradí od hodnocení.

Je ale otázka, jací nadšenci budou na Wikii.com tvořit obsah. U Wikipedie to bylo něco jiného. Úkol od začátku vytvořit encyklopedii a komunitně ji upravovat zní sice obrovsky, ale každý může začít s nějakou oblastí a výsledkem jsou reálné, postupně se organicky rodící články. Na Wikii jsou výsledky práce pomíjivější (zkuste někomu říci: podívej se na miničlánek u Prague, ten jsem psal já) a navíc je u vyhledávače potřeba, aby byly výsledky neustále aktuální. K tomu je právě ideální strojová analýza a matematické řazení výsledků.

Wikia.com - nutch

O řazení se stará Nutch, open-source projekt snažící se o vyhledávač. Vpravo můžete přepínat mezi několik soubory indexovaných dat - velice zajímavá funkce, nicméně paradoxně čím větší index, tím horší výsledky zatím Wikia (subjektivně) nabízí.

Češi budou mít k Wikia Search ještě další námitku: česká diakritika nefunguje. To je samozřejmě odpustitelné, když vezmeme v úvahu, jak malé procento celosvětového webu je v českém jazyce, nicméně Wikia si dělá ambice na celosvětový vyhledávač, a úvodní stránka má i svou českou verzi. Je tedy velice nešťastné uvést ji do provozu s nefunkční diakritikou - Češi tak nemůžou pořádně přispívat, protože ačkoli v miničláncích české znaky fungují, ve vyhledávání nikoli. Je to škoda i proto, že se nejspíše jedná o nějakou chybu v kódování dat nebo v zacházení s nimi, a taková chyba by snad šla opravit. Snad se tak brzy stane.

Příliš brzy na posuzování

Není divu, že se na Wikii sesypalo mnoho kritiky, a to jak z úst technických redaktorů, tak z klávesnic blogerů z celého světa. Jim Wales se k této kritice vyjádřil pro magazín Wired

Když jsem spustil Wikipedii, napsal jsem na začátek stránky "Wikipedia, otevřená encyklopedie". Ten den by se kdokoli, kdo by tu stránku recenzoval, musel smát. Co to má být? Vždyť tu nic není. To není encyklopedie, to je prázdná stránka s divným způsobem editace.

Takže srovnání [vyhledávače Wikia] s Googlem v den jedna je pomýlené. Google nespustil projekt vytvořit lidmi poháněný vyhledávač, spustil vyhledávač založený na nových chytrých algoritmech. Takže nemuseli čekat, až přijdou lidé a něco vytvoří.

Dokonce ještě nejedeme na skutečných indexovaných datech, jenom na těch poskytnutých třetí stranou. Ano, vyhledávač [Wikie] teď nestojí za nic. Ale o to nejde. Jde o to, že vytváříme něco odlišného.

When I launched Wikipedia, I wrote at the top of the first page "Wikipedia, the free encyclopedia". On that day, anyone reviewing it would have laughed. What's this? There's nothing here! This is not an encyclopedia, it is an empty website with some funny editing syntax!

So the comparison to Google on day one is just mistaken. Google didn't launch a project to build a human-powered search engine, they launched an algorithmic search engine with a clever new idea. So they didn't have to wait for the humans to come in and start building it.

We aren't even running with a real index yet, just a placeholder index. Yeah, the search sucks today. But that's not the point. The point is that we are building something different.


A to je myslím podstata věci. Protože se nejedná o chladné počítače a propracované algoritmy, ale o lidi, nemůžeme vlastně vůbec předvídat, co z tohoto projektu nakonec bude. Můžeme spekulovat o tom, že by bylo lepší počkat s uveřejněním až do chvíle, kdy budou výsledky použitelnější. Můžeme vyčítat, že je open-source vyhledávač náchylný ke spamu, zatímco utajené algoritmy s ním mohou účinněji bojovat, to se ovšem těžko prokáže jinak, než praxí.

Můžeme vypočítat mnohé, co Wikii chybí, ale ambice a nadšení to zřejmě nejsou. Jestli se najde dostatek nadšenců na to, aby obětovali svůj čas za lepší vyhledávání, může být Wikia Search časem použitelným vyhledávačem, který bude v některých případech lépe vybaven, než dnešní vyhledávače. Zatím tomu tak sice zdaleka není, ale argument s Wikipedií ze dne jedna nás nabádá, abychom ještě pár let vydrželi.

Odkazy

Autor:
  • Nejčtenější

KVÍZ generála Pattona. Vypořádejte se s ocelovou lavinou

v diskusi je 7 příspěvků

28. dubna 2024

Jak jste dobří v tancích, poznáte je nejen na plese, ale i v následujícím kvízu. Kvíz je zaměřen na...

Čekání na české lidové auto nemělo konce. Před 100 lety jezdili jen boháči

v diskusi je 25 příspěvků

28. dubna 2024

Před 100 lety Čechoslováci marně čekali na tuzemské lidové auto. Drtivá většina obyvatel si totiž...

{NADPIS reklamního článku dlouhý přes dva řádky}

{POPISEK reklamního článku, také dlouhý přes dva a možná dokonce až tři řádky, končící na tři tečky...}

Sphere jako osmý div světa? Zábavní komplex ve Vegas je technologický zážitek

v diskusi je 21 příspěvků

25. dubna 2024

Uvidíte v ní famózní obraz s nejvyšším rozlišením na světě, do uší zahraje sto šedesát tisíc...

Necháte se nachytat na triky internetových podvodníků?

v diskusi je 18 příspěvků

29. dubna 2024

Typickou obětí internetového podvodu už nejsou jen senioři. Kyberzločinci se zaměřili i na mladší...

{NADPIS reklamního článku dlouhý přes dva řádky}

{POPISEK reklamního článku, také dlouhý přes dva a možná dokonce až tři řádky, končící na tři tečky...}

Na Ukrajině zuří válka dronů. Co jsou sebevražedné drony a vyčkávací munice?

v diskusi je 13 příspěvků

30. dubna 2024

Sebevražedné drony a vyčkávací munice zažily obrovský rozvoj, protože se dají vyrobit za pár...

Na první pohled to vypadá jako pavouci v ruinách města. Foto je ovšem z Marsu

v diskusi jsou 4 příspěvky

2. května 2024  15:16

Evropská vesmírná agentura zveřejnila minulý týden nový snímek ze sondy Mars Express, který vyvolal...

Švýcarská železniční chlouba se nemá zač stydět, i když nakonec zčervenala

v diskusi nejsou příspěvky

2. května 2024

Na světě najdeme mezi železničními lokomotivami řadu velkých legend, jednou z nich je i švýcarská...

Devět praktických triků pro užívání Windows. Usnadněte si práci s textem

v diskusi je 8 příspěvků

1. května 2024

Ať už připravujete itinerář dovolené, dokument pro šéfa či esej do školy, jistě toužíte potom, aby...

Na Ukrajině zuří válka dronů. Co jsou sebevražedné drony a vyčkávací munice?

v diskusi je 13 příspěvků

30. dubna 2024

Sebevražedné drony a vyčkávací munice zažily obrovský rozvoj, protože se dají vyrobit za pár...

Chcete, aby vaše děti měli v dospělosti bohatství? Přečtěte si, jak na to!
Chcete, aby vaše děti měli v dospělosti bohatství? Přečtěte si, jak na to!

Správné finanční návyky a dovednosti vznikají právě v dětství. Mnoho dětí je přijímá přirozeně od svých rodičů, kteří jsou pro děti velkým vzorem....

Natáčení Přátel bylo otřesné, vzpomíná herečka Olivia Williamsová

Britská herečka Olivia Williamsová (53) si ve čtvrté sérii sitcomu Přátelé zahrála epizodní roli jedné z družiček na...

Byli vedle ní samí ztroskotanci, vzpomíná Basiková na muže Bartošové

Byly každá z jiného těsta, ale hlavně se pohybovaly na opačných pólech hudebního spektra. Iveta Bartošová byla...

Autofotka: Sen z plakátů v kotrmelcích. Mladíček v tunelu rozbil Ferrari F40

Symbol italské nenažranosti se již skoro čtyři dekády pokouší zabít své řidiče. Jízda s Ferrari F40 bez posilovače...

Ukaž kozy, řvali na ni. Potřebovala jsem se obouchat, vzpomíná komička Macháčková

Rozstřel Pravidelně vystupuje v pořadu Comedy Club se svými stand-upy, za knihu Svatební historky aneb jak jsem se nevdala se...

Do Bolívie jsem odešla kvůli smrti rodičů, přiznala sestra Romana Vojtka

Mladší sestra herce Romana Vojtka (52) Edita Vojtková (49) je módní návrhářkou a žije v Bolívii. Do zahraničí odešla...