Egyre eredményesebbek, de egyelőre távolról sem tökéletesek a póker programok. Valószínűleg többet kellene tanulniuk az embertől, még a hibáinkat.
2016. február 26. 09:00
p
0
0
1
Mentés
A táblás és kártyajátékok pontosan kidolgozott szabályaikkal, speciális célokkal a mesterségesintelligencia-kutatás kihívásokban bővelkedő, de nagyon izgalmas terepei. Sakk, dáma, go és a többiek mellett a logikailag ugyan egyszerűbb, de stratégiailag komplex póker szintén népszerű.
A hiányos információ problémája
Elsősorban abban különbözik tőlük, hogy nem-determinisztikus játék, mert a véletlen szerepe fontos, valamint hiányos (rejtett) információt is tartalmaz. A sakkban nincs ismeretlen, a pókerben a szabályok és a korlátok ellenére mindig van. Ez azért gond, mert a hézagos vagy nem megbízható információ kezelése, a bizonytalan feltételek közötti döntéshozás a számítástudomány egyik alapproblémája.
Nekünk embereknek ellenfelünk tekintete, arcmozgása árulkodik, egy botnak viszont semmit nem mond, semmiféle pluszadathoz nem jut hozzá. Mi hozzászoktunk a hiányzó információ kezeléséhez, számukra azonban monumentális kihívás. Ugyanez jellemzi az életet is – tárgyalás, alkudozás, aukció: mind, mind „nem teljes” információval folytatott játék.
„A póker csomó olyan helyzet mikrokozmosza, amellyel a valóságban találkozunk” – véli Jonathan Schaeffer, a kanadai Alberta Egyetem sakkprogramokkal foglalkozó kutatója.
A póker matematikája
A számítógépes környezet teljesen megváltoztatta a póker arculatát: bevett stratégiákkal hagytak fel, újak kerültek előtérbe, pörgősebbek, rövidebbek a menetek. Szoftveres szimulációban ideális gyakorolni, mert a stratégiák, nüánszok jobban látszódnak, és a legváltozatosabb lapkombinációkat többezer, akár millió meneten keresztül tesztelhetők. A programok, az állandóan a biztonságra ügyelőtől az ész nélkül hazardírozóig eltérő, színes játékos-archetípusokat „személyesítenek meg.”
A fejlesztők nagy része azonban nem szimpla gyakorlótársat, hanem több szakterület (MI, gazdaságtan stb.) eredményit alkalmazó valódi ellenfeleket tervez. A póker matematikájának mélységeit ismerő botok a legjobb stratégiákat keresik, a játék szépsége helyett a győzelem lebeg előttük. Többségük fizetős, főként havidíjas, de egyiket-másikat ingyen is letölthetjük. Folyamatosan fejlesztik őket, legjobbjaik blöffölni is tudnak, bár nem az a fő fegyverük: úgy programozzák őket, hogy a szabályoknak és a mindenkori lapleosztásnak megfelelően kiválasszák a legjobb stratégiát, majd annak megfelelően cselekedjenek.
Megmérettetések
Az első hivatalos ember-gép pókercsatára 2005-ben került sor, az ír-amerikai Phil „The Unabomber” Laak győzelmével. 2008 nyarán viszont az Alberta Egyetem és a Stoxpoker edző-honlap közös rendezésű las vegasi tornáján az egyetem által fejlesztett Polaris 3 győzelemmel, 2 vereséggel és 1 döntetlennel nyert.
2015. április-májusban a Carnegie Mellon Egyetem Claudiója a világ top 10 játékosai közül néggyel vívott meg egy sorozatot. 80 ezer leosztás után az emberek nyertek, de győzelmüket statisztikailag „nem-szignifikánsként”, inkább döntetlenként értékelte a szakma.
2006 óta a legkiválóbb botok nyaranta, 2011 óta pedig három pókerfajtában mérik össze tudásukat. Az utóbbi években hárman uralták a versenyeket. Egyikük természetesen az Alberta Egyetem, ahol tucatnyian írják a programokat. A Carnegie Mellon Tartanian botja szintén egyre masszívabb eredményeket ér el, míg a harmadik Eric Jackson független fejlesztésű Slumbotja. A legtöbb boton évekig dolgoznak, többmillió, ha nem milliárd játszmában vesznek részt.
A világverő is hibázik
2015-ben az albertaiak ismertették világverő Cepheusuk működését. Rengeteg gyakorlás után elérte a másodpercenkénti kétezer játszma sebességet, szinte az összes lehetséges lépést végigvette, stratégiájában egyre kevesebb lett a hibafaktor. A sajnálkozást minimalizáló algoritmussal dolgozva, minden játszma után visszatekint: mi történt volna, ha másként tette volna ezt és ezt. Így tanul a hibáiból.
Megmutatta, hogy a legbonyolultabb helyzetekre is található optimális stratégia. A kutatók szerint az algoritmus sok más forgatókönyvre szintén alkalmazható: part menti őrjáratra, orvosi kezelésre stb.
A javuló sakk, dáma, póker stb. programokkal nagy a kísértés, hogy kimondjuk: az ember előbb-utóbb esélytelen. Különösen akkor az, ha úgy próbál eljárni, mint a gépek. Ha például számításokba bonyolódik, amiben egyértelműen jóval lassabb…
Csakhogy a gépek is küszködnek egyes helyzetekben. Minél hosszabb ideig tart egy játszma, annál esélyesebbek, de ha pillanatokon belül kell döntésre vinni a dolgokat, könnyen elbuknak. Túl sok adat kell nekik, míg az ember kevés információból is következtet, hipotézist állít fel stb. Agresszivitásban, ellenféllel szembeni nyomásgyakorlásban szintén jobbak vagyunk. Ha túl nagy a nyomás, a gyakran elkapkodott, hirtelen döntéseket hoz és veszít a másik.
A legyőzhetetlen botnak ezt sem ártana elsajátítania. Minket utánozva tenné, és talán még a hibáinkat is másolná. Biztos okulna belőlük.
Afrika is igyekszik bekapcsolódni a mesterségesintelligencia-versenybe a hiányos infrastruktúra és finanszírozás ellenére. A kutatók azonban leszögezik, hogy semmiképpen sem úgy, ahogyan azt a Nyugat szeretné.
Azt gondolnánk, hogy a hangyák csak vonulnak és a raj-intelligenciával élik a kis egyszerű életüket. De mi van, ha a bitang erős rovarok élére áll valaki, aki ért a stratégiához?
A francia elnök szerint az Egyesült Államok jogosan oldotta fel az ukrán rakétahasználatra vonatkozó korlátozásokat, mivel Oroszország eszkalálta a háborút.
Chris Wright, a Liberty Energy vezérigazgatója lehet Donald Trump leendő kabinetjének energiaügyi minisztere. Az úttörő palagáz-szakértő kinevezésével Trump célja az amerikai energiadominancia visszaállítása és az infláció megfékezése.