Klávesové zkratky na tomto webu - základní­
Přeskočit hlavičku portálu


Go má svého boha: umělá inteligence porazila nejlepšího hráče světa 3:0

  17:14aktualizováno  30. května 11:12
Software AlphaGo si poradil s nejlepším hráčem go současnosti. V sérii na dva vítězné zápasy zvítězil celkem jednoznačně, jednotlivá střetnutí byla přesto zajímavá.

Kche Ťie během druhého zápasu s AlphaGo | foto: Stringer Reuters

V čínském Wu-čenu nedaleko Šanghaje se v druhé polovině května střetli dvě největší hvězdy oblíbené východoasijské hry go: devatenáctiletý čínský profesionální hráč Kche Ťie (v anglickém přepisu Ke Jie) a software AlphaGo se střetli. Dvojice sehrála za velkého zájmu místních i zahraničních médií i fanoušků sérii na dva vítězné zápasy, která potvrdila, že počítače nás lidi v zřejmě nejsložitější tahové hře definitivně překonala, a že se od ní můžeme leccos naučit. (Záznamy zápasů s anglickým komentářem můžete zhlédnout na YouTube kanálu tvůrců AlphaGo.)

Rozhodnuto už bylo po dvou prvních zápasech ve středu a ve čtvrtek. Poslední sobotní zápas byl byl sice jenom o čest, ovšem i v něm nakonec Kchce Ťie podlehl. AlphaGo v obou poměrně jasně zvítězil. V prvním to sice nakonec bylo jen o půl bodu, ale z něj lidský hráč umazal díky velmi opatrné koncovce, ve které AlphaGo se podle nastavených priorit snaží především zvyšovat pravděpodobnost výhry, nikoliv maximalizovat, o kolik vyhraje. Ve zbylých dvou partiích čínský profesionál vzdal.

Jasné celkové vítězství počítače neznamená, že by zápasy nebyly zajímavé, ba naopak. Ve všech se našly velmi zajímavé a (pro člověka) vypjaté pasáže. Čínský hráč po druhém zápase řekl, že jeho největší chybou bylo propadnout emocím ve velmi otevřeném souboji v prostřední části zápasu. Situace na herní desce byla v tu chvíli velmi nepřehledná, ze které se pak AlphaGo vynořil jako celkem jasný vítěz: „Cítil jsem, jak mi buší srdce, a zahrál jsem hloupé tahy. To je možná největší lidská slabina,“ řekl pak Kche Ťie. Ten přitom sehrál i podle týmu tvůrců AlphaGo z firmy DeepMind podle všeho zhruba sto tahů prakticky bezchybně, pak nakonec podlehl počítači poměrně jasně.

Čínský profesionál svého soupeře po všech zápasech samozřejmě chválil. Mimo jiné řekl, že oproti minulému roku se AlphaGo výrazně zlepšil a poprvé to pro něj opravdu vypadalo, že hraje proti člověku. S tím rozdílem, že je prostě moc dobrý. „AlphaGo podle mého představuje naprostou dokonalost, je to bůh go,“ řekl po druhém zápase. AlphaGo obsahuje učenlivou neuronovou síť, a tak se nárůst výkonnosti dal čekat. O architektuře AlphaGo jsme psali v našem prvním větším článku o této umělé inteligenci nebo také v článku o „pokerové“ AI.

Zápasy se budou nepochybně ještě rozebírat mezi fanoušky i profesionály. Ale už přímo při přenosu si třeba profesionální hráč Michael Redmond v komentáři v průběhu zápasu všiml, jak moc hru čínského mistra ovlivnila dosavadní krátká zkušenost se hrou proti umělé inteligenci. I Kche Ťie v tomto souboji zahrál tahy, které popularizoval AplhaGo, když na přelomu roku sehrál pod pseudonymem Master zhruba 60 bleskových on-line partií s profesionály na několika specializovaných serverech (psali jsme zde). I ti nejlepší už se učí od počítačů.

Software teď čeká další velmi zajímavý test, kdy se proti sobě postaví dva profesionálové s AlphaGo po boku. Podle zkušeností autorů programu špičkový amatér s pomocí AlphaGo obvykle přehraje stejný software hrající bez dozoru člověka. Člověk s počítačem dohromady jsou tedy stále silnější než samotný počítač, a mohli by společně objevit ve starobylé hře nové, zajímavé varianty.

Informace: Do článku jsme doplnili informace o výsledku poslední partie a opravili jsme špatně uvedené jméno Michaela Redmonda.

Jak funguje AlphaGo

Software AlphaGo je složen z kombinace neuronových sítí a prohledávání stromu možných tahů. Neuronové sítě jsou systémy umělé inteligence založené na principech odkoukaných od mozku. Tvoří je celá řada „neuronů“ propojených za sebou i mezi sebou, které se (hodně zjednodušeně řečeno) postupně samy i s pomocí programátorů učí ze vstupních dat dojít ke správnému výsledku. Postupně se tak „ladí“, trénují a vylepšují, a dokážou tak dnes běžně zvládat úkoly, které jiným typům algoritmů dělaly velké problémy: třeba rozpoznávání obličejů atp. Hluboké neuronové sítě se od běžných neuronových sítí liší hlavně tím, že mají více vrstev. V případě AlphaGo běží výpočet ve 13 vrstvách nad sebou najednou.

AlphaGo má dvě hlavní neuronové sítě, každá má jinou úlohu. První bychom mohli nazvat jako „strategickou“ (autoři ji nazvali policy network), protože provádí jakýsi předvýběr vhodných možností pro další tah. Druhá je síť „hodnotící“ (value network) a hodnotí pozice jako dobré nebo špatné.

Neuronové sítě zúží výběr natolik, aby druhá část AlphaGo - stromové prohledávání - mohla vybrat optimální možnost právě z těch předvybraných. Nemusí tak propočítávat ověřovat stovky možných tahů, ale třeba jen čtyři neuronovou sítí nejdoporučovanější. Právě tato kombinace posunula AlphaGo na špičku současných počítačových hráčů go.

Ukázka jednoduché neuronové sítě se čtyřmi vrstvami po šesti neuronech....

Ukázka jednoduché neuronové sítě se čtyřmi vrstvami po šesti neuronech. Spojnice mezi neurony ukazují „dráhy“, kudy nejčastěji proudí komunikace. Tyto dráhy se posilují nebo oslabují na základě zpětné vazby. Tedy neuron, který dává neužitečný výstup, se buď poučí, nebo zůstane nevyužit.

Autor:


Nejčtenější

Vdechl život zapomenuté technologii, na jeho hodiny je pořadník

Moderní digitrony jsou nádherným designovým prvkem.

Historická technologie ve zcela moderním precizním provedení. Digitronové hodiny „Nixie Clock“ Dalibora Farného slaví...

Byl to nejbohatší šlechtic své doby, teď archeologové objevili jeho hrobku

Díváte se na takzvaný radarogram. To je výstup z měření georadarem na profilu...

V následujících dnech se dozvíme, zda tušení týmu českých archeologů, že objevili dosud neznámou hrobku nejbohatšího...



Fascinující paradox: český kutil vyrábí funkční parní stroje ze skla

Skleněné parní stroje z dílny Michala Zahradníka

Michal Zahradník je český sklář osmé generace. Od roku 1991 kromě obvyklých sklářských výrobků ve své dílně vyrábí i...

Eurotank bude německo-francouzský hybrid. Demonstrátor už jezdí a střílí

EMBT je hybrid mezi tanky Leopard 2 a Leclerc

Až 5000 tanků v hodnotě 75 miliard eur by měly dle německých prognóz nakoupit v příštích 20 až 30 letech evropské...

YouTube jako továrna na peníze. Jak na tomto portálu funguje reklama?

YouTube jako továrna na peníze

Vše se točí kolem peněz a na YouTube to není jinak. Jenže když se do reklamního kolotoče zamotají morálka a etika, může...

Další z rubriky

Vědci stáhli studii o prospěšnosti středomořské diety. A pak ji potvrdili

Ilustrační snímek

„Středomořská strava“ je sice nadužívaný pojem, na druhou stranu jde o jednu z těch z mála „diet“, u které máme alespoň...

Byl to nejbohatší šlechtic své doby, teď archeologové objevili jeho hrobku

Díváte se na takzvaný radarogram. To je výstup z měření georadarem na profilu...

V následujících dnech se dozvíme, zda tušení týmu českých archeologů, že objevili dosud neznámou hrobku nejbohatšího...

Stačilo pár let. Jak rychle se život vrátil na místo dopadu planetky

Ilustrace zobrazující schematicky situaci u dna kráteru Chicxulub několik let...

Podle analýzy vzorků přímo z místa dopadu planetky, která zřejmě vyhubila dinosaury, se život na místo katastrofy...

Najdete na iDNES.cz