Kche Ťie během druhého zápasu s AlphaGo

Kche Ťie během druhého zápasu s AlphaGo | foto: Stringer , Reuters

Go má svého boha: umělá inteligence porazila nejlepšího hráče světa 3:0

  • 7
Software AlphaGo si poradil s nejlepším hráčem go současnosti. V sérii na dva vítězné zápasy zvítězil celkem jednoznačně, jednotlivá střetnutí byla přesto zajímavá.

V čínském Wu-čenu nedaleko Šanghaje se v druhé polovině května střetli dvě největší hvězdy oblíbené východoasijské hry go: devatenáctiletý čínský profesionální hráč Kche Ťie (v anglickém přepisu Ke Jie) a software AlphaGo se střetli. Dvojice sehrála za velkého zájmu místních i zahraničních médií i fanoušků sérii na dva vítězné zápasy, která potvrdila, že počítače nás lidi v zřejmě nejsložitější tahové hře definitivně překonala, a že se od ní můžeme leccos naučit. (Záznamy zápasů s anglickým komentářem můžete zhlédnout na YouTube kanálu tvůrců AlphaGo.)

Rozhodnuto už bylo po dvou prvních zápasech ve středu a ve čtvrtek. Poslední sobotní zápas byl byl sice jenom o čest, ovšem i v něm nakonec Kchce Ťie podlehl. AlphaGo v obou poměrně jasně zvítězil. V prvním to sice nakonec bylo jen o půl bodu, ale z něj lidský hráč umazal díky velmi opatrné koncovce, ve které AlphaGo se podle nastavených priorit snaží především zvyšovat pravděpodobnost výhry, nikoliv maximalizovat, o kolik vyhraje. Ve zbylých dvou partiích čínský profesionál vzdal.

Jasné celkové vítězství počítače neznamená, že by zápasy nebyly zajímavé, ba naopak. Ve všech se našly velmi zajímavé a (pro člověka) vypjaté pasáže. Čínský hráč po druhém zápase řekl, že jeho největší chybou bylo propadnout emocím ve velmi otevřeném souboji v prostřední části zápasu. Situace na herní desce byla v tu chvíli velmi nepřehledná, ze které se pak AlphaGo vynořil jako celkem jasný vítěz: „Cítil jsem, jak mi buší srdce, a zahrál jsem hloupé tahy. To je možná největší lidská slabina,“ řekl pak Kche Ťie. Ten přitom sehrál i podle týmu tvůrců AlphaGo z firmy DeepMind podle všeho zhruba sto tahů prakticky bezchybně, pak nakonec podlehl počítači poměrně jasně.

Čínský profesionál svého soupeře po všech zápasech samozřejmě chválil. Mimo jiné řekl, že oproti minulému roku se AlphaGo výrazně zlepšil a poprvé to pro něj opravdu vypadalo, že hraje proti člověku. S tím rozdílem, že je prostě moc dobrý. „AlphaGo podle mého představuje naprostou dokonalost, je to bůh go,“ řekl po druhém zápase. AlphaGo obsahuje učenlivou neuronovou síť, a tak se nárůst výkonnosti dal čekat. O architektuře AlphaGo jsme psali v našem prvním větším článku o této umělé inteligenci nebo také v článku o „pokerové“ AI.

Zápasy se budou nepochybně ještě rozebírat mezi fanoušky i profesionály. Ale už přímo při přenosu si třeba profesionální hráč Michael Redmond v komentáři v průběhu zápasu všiml, jak moc hru čínského mistra ovlivnila dosavadní krátká zkušenost se hrou proti umělé inteligenci. I Kche Ťie v tomto souboji zahrál tahy, které popularizoval AplhaGo, když na přelomu roku sehrál pod pseudonymem Master zhruba 60 bleskových on-line partií s profesionály na několika specializovaných serverech (psali jsme zde). I ti nejlepší už se učí od počítačů.

Software teď čeká další velmi zajímavý test, kdy se proti sobě postaví dva profesionálové s AlphaGo po boku. Podle zkušeností autorů programu špičkový amatér s pomocí AlphaGo obvykle přehraje stejný software hrající bez dozoru člověka. Člověk s počítačem dohromady jsou tedy stále silnější než samotný počítač, a mohli by společně objevit ve starobylé hře nové, zajímavé varianty.

Informace: Do článku jsme doplnili informace o výsledku poslední partie a opravili jsme špatně uvedené jméno Michaela Redmonda.

Jak funguje AlphaGo

Software AlphaGo je složen z kombinace neuronových sítí a prohledávání stromu možných tahů. Neuronové sítě jsou systémy umělé inteligence založené na principech odkoukaných od mozku. Tvoří je celá řada „neuronů“ propojených za sebou i mezi sebou, které se (hodně zjednodušeně řečeno) postupně samy i s pomocí programátorů učí ze vstupních dat dojít ke správnému výsledku. Postupně se tak „ladí“, trénují a vylepšují, a dokážou tak dnes běžně zvládat úkoly, které jiným typům algoritmů dělaly velké problémy: třeba rozpoznávání obličejů atp. Hluboké neuronové sítě se od běžných neuronových sítí liší hlavně tím, že mají více vrstev. V případě AlphaGo běží výpočet ve 13 vrstvách nad sebou najednou.

AlphaGo má dvě hlavní neuronové sítě, každá má jinou úlohu. První bychom mohli nazvat jako „strategickou“ (autoři ji nazvali policy network), protože provádí jakýsi předvýběr vhodných možností pro další tah. Druhá je síť „hodnotící“ (value network) a hodnotí pozice jako dobré nebo špatné.

Neuronové sítě zúží výběr natolik, aby druhá část AlphaGo - stromové prohledávání - mohla vybrat optimální možnost právě z těch předvybraných. Nemusí tak propočítávat ověřovat stovky možných tahů, ale třeba jen čtyři neuronovou sítí nejdoporučovanější. Právě tato kombinace posunula AlphaGo na špičku současných počítačových hráčů go.

Ukázka jednoduché neuronové sítě se čtyřmi vrstvami po šesti neuronech. Spojnice mezi neurony ukazují „dráhy“, kudy nejčastěji proudí komunikace. Tyto dráhy se posilují nebo oslabují na základě zpětné vazby. Tedy neuron, který dává neužitečný výstup, se buď poučí, nebo zůstane nevyužit.