Premium

Získejte všechny články
jen za 89 Kč/měsíc

Sportovní články už mohou psát roboti. Dokážou to lépe než lidé

Počítačový program dokáže okomentovat sportovní zápas, popsat všechny důležité okamžiky i zhodnotit výsledek. A někdy to umí lépe než lidé. Mohli se o tom přesvědčit čtenáři univerzitního serveru GWSports.com.

ilustrační foto

Během univerzitního baseballového zápasu se nadhazovači W. Robertsovi podařila nevídaná věc. Stal se prvním, komu se po téměř deseti letech podařilo zahrát takzvanou perfect game. To je podobně vzácná událost, jako kdyby Kometa Brno vyhrála ligu. Čtenáři univerzitního serveru GWSports.com se však z článku o zápasu o úspěchu mladého nadhazovače nedozvěděli. 

Co je to perfect game

Perfektní hra (perfect game) je hra, ve které nadhazovač (nebo více nadhazovačů téhož mužstva) má v nejméně devíti směnách vždy úspěšné nadhozy a žádný soupeř nedosáhne mety. 

Je to podobné jako takzvaný kanár v tenise, kdy soupeř neuhraje ani bod.

Na internetu se objevily spekulace, že právě tento článek byl psán "robotem" a nikoliv člověkem. Jedině robot totiž mohl vynechat tak důležitou událost z textu. Automatické systémy pro psaní sportovních článků se v USA používají již rok.

Vydavatel webu ovšem přiznal, že text psal nezkušený novinář, který dostatečně neznal pravidla ani historii baseballu a události si nevšiml. Tvůrci "robotů novinářů" z firmy Narrative Science pojali celou událost jako výzvu a zadali data ze zápasu do programu. Vznikl bezchybný text, kde je výjimečná událost správně zmíněna ihned v úvodu.

Pokud by vás to zajímalo, zápas Virginia vs. George Washington skončil 2:0 i díky Robertsově perfect game. Robotem psaný text si můžete přečíst zde (pouze v angličtině).

Stačí statistika

Počítač potřebuje k napsání sportovního článku statistická data (kdo, kdy a kolik). Stejně by v budoucnu podle serveru Thenextweb.com mohly vznikat například články s informacemi z finančních trhů. Podle výrobce může počítač psát i analýzy trhu s nemovitostmi. 

Velkou výhodou robotického novináře je, že se na rozdíl od člověka nesplete. O možnostech softwaru, který automaticky přetvoří nezáživná data na čtivý článek, se začalo mluvit přibližně před rokem. Právě tehdy vznikly dva projekty StatSheet a StatsMonkey, které již nevyužívají služeb novinářů. Sportovní články o baseballu generují během několika málo sekund ze statistických dat dané hry.

Systém Stats Monkey používá dvě technologie. První je založena na statistickém modelu hry (v tomto případě baseballu), podle které počítač pozná, co se ve hře stalo zajímavého. Analýzou pravděpodobnosti výhry daného mužstva a podle předchozích výsledků dokáže například pochválit klíčové hráče (a samozřejmě zaznamenat takovou událost, jakou je perfect game).

Součástí programu je knihovna vypravěčských výrazů (typických pro daný sport), kterým dokonale popíše průběh zápasu. Počítač si všimne i takových nuancí jako neočekávané vítězství týmu, u kterého by to nikdo netipoval, neobvykle dramatické hry, atd. 

Článek může být podle přání napsán z pohledu jakéhokoliv týmu (např. týmu České republiky) a jednoduše lze předem určit i jeho délku.

Program lze podle výrobce využít pro jakýkoliv sport nebo odvětví, které poskytne dostatečné množství relevantních dat. Samozřejmě, že těžko okomentuje výkon rozhodčího nebo třeba gólové šance a sporné momenty hry. Nutno také podotknout, že styl sportovních článků a přístup sportovních komentátorů je v USA velmi odlišný od českého.

Počítač vygeneruje i vědecky znějící články

Na "píšící počítače" jsme se zeptali Jana Kleindiensta, vedoucího R&D Labu společnosti IBM. Právě firma IBM nedávno představila nejinteligentnější počítač na světě. Watson, jak se stroj jmenuje, dokázal dokonce porazit člověka ve vědomostní hře typu Riskuj. Více v tomto článku.

Superpočítač porazil člověka

a chce být superdoktorem.

Je složité, aby se počítač naučil psát na základě statistických dat například články o fotbale?

Záleží na složitosti domény (daného sportu), množství dostupných dat, použité metodě a hloubce zkušeností tvůrců systému. Obecně jde o úlohu zvanou "natural language generation" (NLG), která se dá řešit jednodušeji či složitěji. V triviálním případě použitím ručně psaných pravidel pro generování textu (tzv. gramatik), ve složitějším provedení statistickým modelem natrénovaným z velkého vzorku dat. Například systém univerzity MIT v Bostonu umí vygenerovat vědecky znějící článek tak, že některá dílka byla dokonce omylem přijata na odborné konference.

Jaká data bude počítač vždy potřebovat, aby článek mohl vzniknout?

Je potřeba definovat a modelovat jak vnitřní počítačovou reprezentaci dat (vstup), tak její mapování na psaný přirozený jazyk (výstup) pro požadovanou doménu (fotbal, burza, počasí) a pro příslušný jazyk. První typ dat jsou obvykle znalostní báze nebo logické formy, v druhém případě jde o příklady vět z přirozeného jazyka, které korespondují s příklady ze znalostní báze. A to v závislosti na formě, stylu a jazykové aktuálnosti požadované pro daný článek. Pro statistické modelování platí zlaté pravidlo: čím více dat, tím lépe pro výsledný efekt.

Jak moc musí být daný algoritmus přizpůsoben pro daný obor? Jinými slovy, dokázal by stroj na fotbal psát články o tenise nebo finančních trzích?

Při podobnosti domén (sportů, oborů, atd.) lze část modelu či trénovacích dat použít pro společné jádro systému (sport) a pak specializovat jednotlivé moduly (fotbal, hokej, tenis) natrénované ze specifických dat. Pro obory, které mají od sebe dál, se obvykle buduje každý systém samostatně, i když se v závěru mohou pro uživatele tvářit jako jednotný systém.

Má v sobě takový algoritmus například Watson? Dokázal by psát Watson
články?

Watson je primárně postavený pro opačnou (a obvykle těžší) úlohu, tedy porozumění přirozenému jazyku "natural language understanding" (NLU) a hledání relevantních odpovědí na otázky "question answering" (QA). Nicméně obsahuje i moduly na generování jazyka pro potřeby aplikací, ve kterých je používán tak, aby sděloval svá zjištění uživatelům v přirozené řeči. Psaní článků zatím nebylo na seznamu .

Zřejmě bude jednodušší celý algoritmus připravit pro angličtinu než pro
češtinu? O kolik? A je podle vás možné v dohledné době očekávat takový česky píšící stroj?

Z hlediska variability je čeština samozřejmě složitější než angličtina, nicméně principy modelování načrtnuté výše zůstávají stejné. Takovýto systém obvykle najde z laboratoří cestu ven v okamžiku, kdy se objeví výrazný zájem na trhu. To platí i pro české prostředí.

Autor:
  • Nejčtenější

Zázrak! NASA po pěti měsících obdržela od sondy Voyager smysluplnou zprávu

v diskusi je 171 příspěvků

23. dubna 2024  13:37

Když se v únoru letošního roku stále nedařilo navázat smysluplnou komunikaci s jedním z...

Herečce Slávce Budínové by bylo 100 let. Zemřela opuštěná, bez zájmu veřejnosti

v diskusi je 29 příspěvků

21. dubna 2024

Před 100 lety, 21. dubna 1924, se v Ostravě narodila známá česká herečka Slávka Budínová.

{NADPIS reklamního článku dlouhý přes dva řádky}

{POPISEK reklamního článku, také dlouhý přes dva a možná dokonce až tři řádky, končící na tři tečky...}

Unikátní exkurze. Nahlédněte do francouzské jaderné ponorky před vyplutím

v diskusi je 16 příspěvků

20. dubna 2024

Není obvyklé, aby reportéři mohli nahlédnout do jaderné ponorky v aktivní službě. Agentura AP nyní...

Proč umělá inteligence lže a proč kvůli ní zhloupneme. Počítačový expert vypráví

v diskusi je 17 příspěvků

22. dubna 2024

Premium Zatímco průmyslová revoluce zaváděla masivní využití strojů, které nahradily lidské svaly, nyní...

{NADPIS reklamního článku dlouhý přes dva řádky}

{POPISEK reklamního článku, také dlouhý přes dva a možná dokonce až tři řádky, končící na tři tečky...}

Byla to druhá nejjasnější hvězda. V budoucnu může svítit jako druhý Měsíc

v diskusi je 17 příspěvků

21. dubna 2024

Velmi neobvyklá hvězda éta Carinae v devatenáctém století náhle zjasnila a stala se druhou...

Pomník Jana Žižky na Vítkově vznikal skoro 30 let

v diskusi je 1 příspěvek

27. dubna 2024

27. dubna 1924 zahájil Spolek pro zbudování pomníku Jana Žižky na Žižkově veřejnou sbírku na jeho...

Přistávat s vrtulníkem je jako balancovat na míči a zůstat při tom něžný

v diskusi nejsou příspěvky

27. dubna 2024

Mysli na to, že při záchraně druhých nesmíš sebe ani nikoho jiného ohrozit. Tak zněla jedna z...

Učili jsme se od alpských záchranářů, líčí pilot počátky letecké záchranky

v diskusi jsou 3 příspěvky

26. dubna 2024

Exkluzivně Za kniplem vrtulníku strávil přes 9 250 hodin. Stál u zrodu letecké záchranné služby, létal s...

Sphere jako osmý div světa? Zábavní komplex ve Vegas je technologický zážitek

v diskusi je 17 příspěvků

25. dubna 2024

Uvidíte v ní famózní obraz s nejvyšším rozlišením na světě, do uší zahraje sto šedesát tisíc...

Jak na rychlou a jednoduchou večeři s rýží?
Jak na rychlou a jednoduchou večeři s rýží?

Díky své všestrannosti se rýže LAGRIS už dlouho stávají nedílnou součástí mnoha pokrmů z celého světa. Bez ohledu na to, zda se používají k...

Bývalý fitness trenér Kavalír zrušil asistovanou sebevraždu, manželka je těhotná

Bývalý fitness trenér Jan Kavalír (33) trpí osmým rokem amyotrofickou laterální sklerózou. 19. dubna tohoto roku měl ve...

Herečka Hunter Schaferová potvrdila románek se španělskou zpěvačkou

Americká herečka Hunter Schaferová potvrdila domněnky mnoha jejích fanoušků. A to sice, že před pěti lety opravdu...

Tenistka Markéta Vondroušová se po necelých dvou letech manželství rozvádí

Sedmá hráčka světa a aktuální vítězka nejprestižnějšího turnaje světa Wimbledonu, tenistka Markéta Vondroušová (24), se...

Horňáci versus dolňáci. Víme, čemu muži dávají přednost, a je to překvapení

Ženské tělo je pro muže celkově velmi atraktivní a nabízí jejich očím mnoho zajímavých partií. Největší pozornosti se...

Za vytlačení z linky do Brna musí Student Agency zaplatit náhradu 21 milionů

Společnost Student Agency provozující autobusy a vlaky pod označením RegioJet musí zaplatit bývalému konkurentovi 21...