Diskuse: Programátoři pokořili poker. Mohli vydělat miliony, vybrali si Science - iDNES.cz

iDNES.cz

Přihlásit Můj účet

Menu

☰

Přihlášení

Diskuze

Programátoři pokořili poker. Mohli vydělat miliony, vybrali si Science

Karetní hra Poker Texas Hold’em je pro počítače neobyčejně náročná. Ještě nedávno měli nejlepší hráči nad počítačovými programy navrch. Letos to přestalo platit. I díky českým programátorům, kteří v článku pro Science popsali svou inovativní umělou inteligenci DeepStack.

Litujeme, ale tato diskuse byla uzavřena a již do ní nelze vkládat nové příspěvky.
Děkujeme za pochopení.

HM

H18y80n91e22k 42M38r87t89v19ý

6. 3. 2017 10:41

casina použití hráči sice zakazují, ale je otázkou času, kdy tyto boty samy nasadí. pár umělých hráčů jim hezky zvedne zisky nad rámec vybírání rakes

0 0

možnosti

zobrazit vlákno

M59i58c62h53a32e10l 64P27r27i38n88c

5. 3. 2017 11:26

Jak definují autoři Nash equilibrium (NE) v pokeru obecně a jak definují NE specificky v HUNL Hold'em?

Mám chápat aproximaci NE tak, že používají neurální sítě k naučení výsledků zpětné indukce? Sice nejsou schopni vypočítat přesně NE ke každému stavu, ale spokojí se s nejlepší přesností, kterou omezí další vrstvou neurální sítě? Klidně mne opravte, rád s dozvím víc.

0 0

možnosti

zobrazit vlákno

M33i83r61o77s75l35a96v 39O66l38š62á92k

5. 3. 2017 15:04

Nevím, kolik toho víte o samotném NE, tak aspoň napíšu základy, které znám já. NE pracuje s diskrétními strategiemi -- "když se hrálo takto a teď je hra v tomto stavu, zahraju za všech okolností tento tah" -- a jejich pravděpodobnostními kombinacemi. Například ve hrách s úplnou informací jako jsou šachy je neprohrávající rovnou nějaká diskrétní strategie, jen ji neznáme. Zato v "kámen, nůžky, papír" máme tři možné diskrétní strategie -- dát kámen, dát nůžky a dát papír -- ale optimální (neprohrávající) strategie je vybrat si náhodně jednu z těchto tří.

Tvrzení o NE říká, že je možné v každé hře několika hráčů rozdat hráčům strategie (pravděpodobnostně navážené), aby žádnému jednotlivému hráči nepomohlo svoji strategii změnit, což se dá ekvivalentně formulovat tak, že se žádnému hráči nevyplatí změnit svou strategii na diskrétní. Obecně to pro hry dvou hráčů znamená, že pro oba hráče existuje optimální strategie, protože když hráčům dáme strategie podle NE, tak je strategie hráče 1 optimální, ať hráč 2 svou strategii jakkoli změní (tedy ať hraje jakkoli).

Pro větší počet hráčů je to problém, protože nepomůže, aby jeden hráč hrál podle NE, musí podle NE hrát všichni až na jednoho hráče. A lidsky řečeno je problém v tom, že se obecně může několik hráčů spiknout proti jednomu. Nevím, ale nakolik tohle může nastat v Pokeru.

Počítat s diskrétními strategiemi přes celou hru by bylo neúnosné, ale neúplná informace je v Pokeru vždy chvliková -- po dobu jednoho "kola" (neznám odborný název), takže stačí hrát v každém kole optimální strategii zvlášť. Takové zjednodušení vyžaduje, aby byly předpočítané optimální šance na výhru na základě množství žetonů, ale odhadnout to nějakou statistikou by nemusel být problém.

V každém kole pak je třeba vyzkoušet všechny diskrétní strategie, kterých je stále příliš. Tady se nějak nasadí předem naučená neuronka odhadující, podobně jako třeba u Go, které možnosti se vyplatí zkoumat, a jak asi vyjdou ty ostatní. Podrobněji do toho nevidím.

0 0

možnosti

zobrazit vlákno

Zobrazit další reakce

M71i30r86o59s17l91a36v 81O89l28š84á34k

4. 3. 2017 15:13

Je pravda, že co jsem se loni bavil s nějakým IBM náborářem, tak říkal, že Poker brzo padne.

Já stále čekám na matematiku -- až počítač porazí lidi v IMO, tak to na mne obzvlášť zapůsobí. Dokonce jsem se do toho výzkumu taky trochu zapojil a zkusil postavit nějakou neuronku. Ale to až tak hned nebude, zatím jsou počítače fakt marní.

0 0

možnosti

zobrazit vlákno

MS

M29a75r63t70i59n 60S43c35h32m23i33d

4. 3. 2017 16:25

Jestli jste se bavil s IBM naborarem zde v Praze, tak je velmi mozne ze mel informace z prvni ruky. Oba prvni autori studie pracuji v Prazskem IBM Watson labu a na rok odjeli do Kanady pracovat na DeepStacku :)

1 0

možnosti

zobrazit vlákno

Zobrazit další reakce

JV

J56a12r25o85s45l98a30v 60V55a65c86e42k

4. 3. 2017 9:04

Není pravda, že šachy jsou vyřešené. Dokonce se tam také velmi výrazně pracuje s pravděpodobností.

Naopak považuji za ukázku nedokonalosti technologií, jaký obrovský výpočetní výkon musel být použit, aby porazil člověka. A to tomu programu pomohli ještě tím, že do něho nabouchali tuny partií. Tedy zdroj rozhodování pro člověka.

0 0

možnosti

zobrazit vlákno

KP

K66a72r91e72l 89P45o48d69h48o58r41s12k22y

4. 3. 2017 14:26

Člověk má neuronů řádově více, také se to musí naučit a stejně mu to nejde tak dobře jako té technologii. Myslím, že to spíš svědčí pro tu technologii ;-)

0 0

možnosti

zobrazit vlákno

Zobrazit další reakce

JV

J64a47r78o33s13l40a79v 47V73a83c43e31k

4. 3. 2017 4:31

Když slyším neuronová síť, tak ztrácím pozornost. Každý algoritmus lze napsat efektivněji bez neuronové sítě. Jen to pak tak nezní.

2 10

možnosti

zobrazit vlákno

VK

V55l37a60s39t72i28m47i86l 19K89a77š85p69a97r

4. 3. 2017 8:03

Pokud je k dispozici ten algoritmus. Je stále mnoho problémů, kde algoritmus znám není...

4 0

možnosti

zobrazit vlákno

Zobrazit další reakce

JK

J85a61k73u73b 24K98r13e31j96č29í

3. 3. 2017 23:15

Az pocitacove programy prekonaji v hrani pokeru lidi a je to jen otazka casu, bude to konec online hrani pokeru.

0 1

možnosti

zobrazit vlákno

JP

J39a70n 26P62r83o19c96h30a21z54k92a

3. 3. 2017 23:13

Pro sedmdesátiletého dědka jako jsem já, který svůj první laptop s programem T 602 začal používat někdy v polovině 90.let, jsou všechny podobné články něco jako science fiction.

10 0

možnosti

zobrazit vlákno

TK

T31o85m60a18s 35K26o78t15a72l

4. 3. 2017 7:49

Na druhou stranu jste i jako "sedmdesátiletý dědek" udržel krok a čtete zprávy na technetu. To může znít jako sci-fi mnoha Vašim vrstevníkům!

11 0

možnosti

zobrazit vlákno

Zobrazit další reakce

M59i84c40h98a58e17l 63P81r58i41n96c

3. 3. 2017 22:20

Chtělo by to trochu doplnit a opravit. Programátoři nepokořili poker, ale jen jednu jeho variantu, která se jmenuje heads-up.

Sami píší, že více hráčů neobehrají. Zajímavé to přesto je.

1 0

možnosti

zobrazit vlákno

P28a36v60e17l 68K17a23s76í64k53, 62T68e16c80h45n45e20t70.39C44z

3. 3. 2017 23:24

Texas Hold'em No Limit je jedna z nejtěžších variant (z pohledu AI), do titulku je to podle mého snesitelná zkratka.

0 0

možnosti

zobrazit vlákno

Zobrazit další reakce

IS

I80v75e18t96a 97S71o67c54h29o36r47o87v23a

3. 3. 2017 22:14

Pokud nepokoří administrativu všeho druhu , tak posunuli poznání nepatrně .

0 0

možnosti

zobrazit vlákno

OU

O65d69s78t91r11a21n49ě24n61ý 20U89ž78i58v63a22t95e91l

3. 3. 2017 21:19

Uživatel požádal o vymazání

0 0

možnosti

zobrazit vlákno

DK

D52u23s60a31n 19K39r62i44v11s61k93y

3. 3. 2017 21:34

Jen se prizpusobi agresivni hre. Kdyz bude nekdo posilat All iny do malych potu, tak neni potreba ani zadny program, aby clovek byl dost plusovy. Tomu neni tezke se prizpusobit. Stovka her neni zadny vzorek, tam muze byt v plusu i nekdo kdo prakticky ani nezna pravidla i proti top hracum.

1 0

možnosti

zobrazit vlákno

Zobrazit další reakce

Načíst další

předchozí

1 2 3

další

Znovuzrození japonských letadlových lodí. Ve výzbroji budou mít F-35B

Námořníci USA propašovali před 100 lety na palubu bitevní lodi prostitutku

Uvidíme v budoucnu na obloze druhý Měsíc? Příčinou může být neobvyklá hvězda

Skvělý filmový zvuk bez velké instalace. Test nejzajímavějších soundbarů

Dawesův plán na čas stabilizoval Německo, ale nástup Hitlera neodvrátil

{NADPIS reklamního článku dlouhý přes dva řádky}

Před 100 lety padl světový rekord v délce letu vrtulníkem

{NADPIS reklamního článku dlouhý přes dva řádky}

Unikátní exkurze. Nahlédněte do francouzské jaderné ponorky před vyplutím

Znovuzrození japonských letadlových lodí. Ve výzbroji budou mít F-35B

Lotyšská armáda je malá, materiálem nehýří, ale Ukrajině něco ze svého poslala

Herní technika

Finance

Osobnosti

Elektromobilita

Termíny

Válka na Ukrajině

Nepřehlédněte

iDNES.cz

© 1998–2024 MAFRA, a. s., a dodavatelé Profimedia, Reuters, ČTK, AP. Rozmnožování obsahu pro účely automatizované analýzy textů nebo dat dle ustanovení § 39c autorského zákona je bez souhlasu MAFRA, a. s., zakázáno. Jakékoliv užití obsahu včetně převzetí, šíření či dalšího zpřístupňování článků a fotografií je bez souhlasu MAFRA, a. s., zakázáno. Provozovatelem serveru iDNES.cz je MAFRA, a. s., IČ: 45313351.