Wikipedia musí rozlišit, co je dobře míněná úprava a co je vtípek či vandalismus

Wikipedia musí rozlišit, co je dobře míněná úprava a co je vtípek či vandalismus | foto: montáž: Pavel Kasík, Technet.cz, Profimedia.cz

„Prezident je fsadfadsfa“ umělá inteligence nepustí. Má povzbudit lidi

  • 28
Největší encyklopedie na světě je otevřená všem úpravám. To znamená, že se zde v jeden okamžik sejdou nováčci i vandalové. Výzkumník z Wikipedie experimentuje s umělou inteligencí, která má poznat, s jakým záměrem byla podezřelá úprava provedena.

„George Bush se narodil na Marsu fjdskafdsafdsajklfdsa!!! LOL“

Člověk nemá problém na první pohled odhalit, že jde o vtípek. Provozovatelé Wikipedie, jedné z nejnavštěvovanějších stránek světa, mají s vandalismem své bohaté zkušenosti. Už od spuštění projektu otevřené encyklopedie v roce 2001 tvoří tzv. „vandalismus“ dlouhodobý problém. Wikipedia se s ním ale vypořádala překvapivě dobře. Zrušit vtipálkovu editaci není složité a zkušení „strážci“ Wikipedie je dokážou postřehnout a opravit v řádu několika minut. „Většina vandalů není zvlášť chytrá,“ všímá si Aaron Halfaker, výzkumník z Wikipedia.org.

Pět milionů článků v angličtině

5 000 000 článků na anglické Wikipedii

Na Wikipedii ale občas píší i běžní čtenáři, kteří si kupříkladu všimli chyby a chtějí ji opravit. A při této opravě se mohou dopustit nějakého nevědomého prohřešku proti pravidlům Wikipedie - třeba špatně odkázat nebo nedodržet zásadu nestranného pohledu na věc. V ideálním případě by se takovýmto odvážlivcům mělo dostat vlídného uvítání: „Děkujeme, že jste provedli svou první editaci. Všiml jsem si, že jste se pokusil odkázat stránku, zde si přečtete, jak do textu vložit odkaz....“ Jenže na takový osobní přístup v posledních letech nemají editoři mnoho času. Výsledkem je i to, že mnoho lidí se zdráhá stránky na Wikipedii editovat, protože se pouze dočetli, že „jejich editace byla zrušena.“

Umělou inteligencí k lepšímu zapojení lidí

Halfaker se výzkumem editací na Wikipedii zabývá už delší dobu. V jedné ze studií došel s kolegy ke smutnému závěru: „Wikipedia se změnila z encyklopedie, kterou může kdokoli editovat, na endyklopedi, kterou může editovat každý, kdo rozumí wikipedickým normám, vztahům, překoná poloautomatickou zeď odmítnutí a i nadále chce věnovat svůj čas a energii editaci.“ Jako hlavní problém Halfaker vnímá často neosobní a zdánlivě elitářský styl komunikace editorů vůči nováčkům.

ORES

Systém se učí na základě manuálně označených editací. Při odhalování vtípku se například řídí počtem znaků, počtem mezer a polohou kláves na klávesnici. „Vandalové totiž často jen tak mlátí do klávesnice,“ dodává Halfaker.

Jeho řešení je na první pohled trochu paradoxní. Proti neosobnímu přístupu totiž bojuje umělou inteligencí nazvanou ORES (Objective Revision Evaluation Service). Postavil ji na volně dostupných nástrojích Scikit a učí ji rozpoznávat, jak se liší vandal od nováčka. A zatímco vandal dostane přes prsty, nováčka ORES přepošle ke zkušenému editorovi z masa a kostí. Ten na něj - jak doufá Halfaker - bude mít více času a přivítá jej se vším všudy.

Halfaker ví, že jeho program není bez chyb. Nedokáže třeba rozpoznat propracovaný klam. A už vůbec nedokáže zjistit, zda to, co nový příspěvek říká, dává smysl v kontextu dalších článků. I tak by ale mělo jít o krok k otevřenější Wikipedii, na které se novým přispěvatelům dostane vřelého uvítání. Zároveň jde o typickou ukázku toho, jak algoritmus, který zdánlivě bere lidem práci, ve skutečnosti může přilákat více lidí.

Dobrovolníci ve službách Wikipedia

Ke svému fungování potřebuje Wikipedia.org tyto a další role:

  • autoři článků
  • editoři článků
  • korektoři článků, fact-checkeři
  • byrokraté
  • administrátoři (volená funkce)
  • grafikové a tvůrci šablon
  • programátoři
  • ombudsmani pro řešení sporů