Premium

Získejte všechny články
jen za 89 Kč/měsíc

Diskuze

Programátoři pokořili poker. Mohli vydělat miliony, vybrali si Science

Karetní hra Poker Texas Hold’em je pro počítače neobyčejně náročná. Ještě nedávno měli nejlepší hráči nad počítačovými programy navrch. Letos to přestalo platit. I díky českým programátorům, kteří v článku pro Science popsali svou inovativní umělou inteligenci DeepStack.
Litujeme, ale tato diskuse byla uzavřena a již do ní nelze vkládat nové příspěvky.
Děkujeme za pochopení.

casina použití hráči sice zakazují, ale je otázkou času, kdy tyto boty samy nasadí. pár umělých hráčů jim hezky zvedne zisky nad rámec vybírání rakes ;-)

0 0
možnosti
Foto

Jak definují autoři Nash equilibrium (NE) v pokeru obecně a jak definují NE specificky v HUNL Hold'em?

Mám chápat aproximaci NE tak, že používají neurální sítě k naučení výsledků zpětné indukce? Sice nejsou schopni vypočítat přesně NE ke každému stavu, ale spokojí se s nejlepší přesností, kterou omezí další vrstvou neurální sítě? Klidně mne opravte, rád s dozvím víc.

0 0
možnosti
Foto

Nevím, kolik toho víte o samotném NE, tak aspoň napíšu základy, které znám já. NE pracuje s diskrétními strategiemi -- "když se hrálo takto a teď je hra v tomto stavu, zahraju za všech okolností tento tah" -- a jejich pravděpodobnostními kombinacemi. Například ve hrách s úplnou informací jako jsou šachy je neprohrávající rovnou nějaká diskrétní strategie, jen ji neznáme. Zato v "kámen, nůžky, papír" máme tři možné diskrétní strategie -- dát kámen, dát nůžky a dát papír -- ale optimální (neprohrávající) strategie je vybrat si náhodně jednu z těchto tří.

Tvrzení o NE říká, že je možné v každé hře několika hráčů rozdat hráčům strategie (pravděpodobnostně navážené), aby žádnému jednotlivému hráči nepomohlo svoji strategii změnit, což se dá ekvivalentně formulovat tak, že se žádnému hráči nevyplatí změnit svou strategii na diskrétní. Obecně to pro hry dvou hráčů znamená, že pro oba hráče existuje optimální strategie, protože když hráčům dáme strategie podle NE, tak je strategie hráče 1 optimální, ať hráč 2 svou strategii jakkoli změní (tedy ať hraje jakkoli).

Pro větší počet hráčů je to problém, protože nepomůže, aby jeden hráč hrál podle NE, musí podle NE hrát všichni až na jednoho hráče. A lidsky řečeno je problém v tom, že se obecně může několik hráčů spiknout proti jednomu. Nevím, ale nakolik tohle může nastat v Pokeru.

Počítat s diskrétními strategiemi přes celou hru by bylo neúnosné, ale neúplná informace je v Pokeru vždy chvliková -- po dobu jednoho "kola" (neznám odborný název), takže stačí hrát v každém kole optimální strategii zvlášť. Takové zjednodušení vyžaduje, aby byly předpočítané optimální šance na výhru na základě množství žetonů, ale odhadnout to nějakou statistikou by nemusel být problém.

V každém kole pak je třeba vyzkoušet všechny diskrétní strategie, kterých je stále příliš. Tady se nějak nasadí předem naučená neuronka odhadující, podobně jako třeba u Go, které možnosti se vyplatí zkoumat, a jak asi vyjdou ty ostatní. Podrobněji do toho nevidím.

0 0
možnosti
Foto

Je pravda, že co jsem se loni bavil s nějakým IBM náborářem, tak říkal, že Poker brzo padne.

Já stále čekám na matematiku -- až počítač porazí lidi v IMO, tak to na mne obzvlášť zapůsobí. Dokonce jsem se do toho výzkumu taky trochu zapojil a zkusil postavit nějakou neuronku. Ale to až tak hned nebude, zatím jsou počítače fakt marní.

0 0
možnosti

Jestli jste se bavil s IBM naborarem zde v Praze, tak je velmi mozne ze mel informace z prvni ruky. Oba prvni autori studie pracuji v Prazskem IBM Watson labu a na rok odjeli do Kanady pracovat na DeepStacku :)

1 0
možnosti

Není pravda, že šachy jsou vyřešené. Dokonce se tam také velmi výrazně pracuje s pravděpodobností.

Naopak považuji za ukázku nedokonalosti technologií, jaký obrovský výpočetní výkon musel být použit, aby porazil člověka. A to tomu programu pomohli ještě tím, že do něho nabouchali tuny partií. Tedy zdroj rozhodování pro člověka.

0 0
možnosti

Člověk má neuronů řádově více, také se to musí naučit a stejně mu to nejde tak dobře jako té technologii. Myslím, že to spíš svědčí pro tu technologii ;-)

0 0
možnosti

Když slyším neuronová síť, tak ztrácím pozornost. Každý algoritmus lze napsat efektivněji bez neuronové sítě. Jen to pak tak nezní.

2 10
možnosti

Pokud je k dispozici ten algoritmus. Je stále mnoho problémů, kde algoritmus znám není... ;-)

4 0
možnosti

Az pocitacove programy prekonaji v hrani pokeru lidi a je to jen otazka casu, bude to konec online hrani pokeru.

0 1
možnosti

Pro sedmdesátiletého dědka jako jsem já, který svůj první laptop s programem T 602 začal používat někdy v polovině 90.let, jsou všechny podobné články něco jako science fiction.

10 0
možnosti

Na druhou stranu jste i jako "sedmdesátiletý dědek" udržel krok a čtete zprávy na technetu. To může znít jako sci-fi mnoha Vašim vrstevníkům! R^

11 0
možnosti
Foto

Chtělo by to trochu doplnit a opravit. Programátoři nepokořili poker, ale jen jednu jeho variantu, která se jmenuje heads-up.

Sami píší, že více hráčů neobehrají. Zajímavé to přesto je.

1 0
možnosti
Foto

Texas Hold'em No Limit je jedna z nejtěžších variant (z pohledu AI), do titulku je to podle mého snesitelná zkratka.

0 0
možnosti

Pokud nepokoří administrativu všeho druhu , tak posunuli poznání nepatrně .

0 0
možnosti

Jen se prizpusobi agresivni hre. Kdyz bude nekdo posilat All iny do malych potu, tak neni potreba ani zadny program, aby clovek byl dost plusovy. Tomu neni tezke se prizpusobit. Stovka her neni zadny vzorek, tam muze byt v plusu i nekdo kdo prakticky ani nezna pravidla i proti top hracum.

1 0
možnosti
  • Nejčtenější

Kam pro filmy bez Ulož.to? Přinášíme další várku streamovacích služeb do TV

v diskusi je 125 příspěvků

26. března 2024

S vhodnou aplikací na vás mohou v televizoru na stisk tlačítka čekat tisíce filmů, seriálů nebo...

Z jaderné triády zbyly Britům už jen ponorky. A ty musejí posílit

v diskusi je 76 příspěvků

27. března 2024

Jadernou triádu tvoří strategické bombardéry s jadernými zbraněmi, mezikontinentální balistické...

{NADPIS reklamního článku dlouhý přes dva řádky}

{POPISEK reklamního článku, také dlouhý přes dva a možná dokonce až tři řádky, končící na tři tečky...}

Hlučínsko patří nám. Před 100 lety byl podepsán definitivní protokol o hranici

v diskusi je 38 příspěvků

28. března 2024

Před 100 lety definitivně skončily tahanice o československo-německé hranice. 28. března 1924 byl...

Rusko zastavilo odlet na ISS s první Běloruskou, letět měla i Američanka

v diskusi je 50 příspěvků

21. března 2024  10:23,  aktualizováno  14:26

Ve čtvrtek 21. března se necelých deset minut před půl třetí odpoledne měla vydat na Mezinárodní...

{NADPIS reklamního článku dlouhý přes dva řádky}

{POPISEK reklamního článku, také dlouhý přes dva a možná dokonce až tři řádky, končící na tři tečky...}

Načapali jsme otesánka, který se velkého sousta nezalekne. Boeing 747-400F

v diskusi je 8 příspěvků

21. března 2024

Poté, co na Letiště Václava Havla Praha přestaly v barvách Qatar Airways létat nákladní Boeingy...

Dočasná raketa se po téměř 70 letech loučí. Bude startovat naposledy

v diskusi jsou 4 příspěvky

28. března 2024  15:36,  aktualizováno  19:54

Tento čtvrtek stojí na startovací rampě mysu Canaveral poslední potomek raket Thor, nosič Delta IV...

Američané odepsali modul, který je vrátil po půl století na Měsíc

v diskusi je 20 příspěvků

28. března 2024,  aktualizováno  11:41

Od začátku letošního roku je na Měsíci a kolem něj poměrně rušno. Vedle řady sond, které zamířily...

Hlučínsko patří nám. Před 100 lety byl podepsán definitivní protokol o hranici

v diskusi je 38 příspěvků

28. března 2024

Před 100 lety definitivně skončily tahanice o československo-německé hranice. 28. března 1924 byl...

Úspěšný let prototypu XB-1 vrací do hry cestování nadzvukovou rychlostí

v diskusi je 34 příspěvků

27. března 2024  17:17

Po více než dvaceti letech, od ukončení provozu letounu Concorde, se možná opět dočkáme nadzvukové...