Olyan lázadás volt Amerikában, ami mindenki életét meg fogja változtatni
Így vagy úgy, de sikerült újra olyan helyzetbe hozni magunkat, hogy alkalmazkodnunk kell. Varga Mátyás Zsolt írása.
Egyre eredményesebbek, de egyelőre távolról sem tökéletesek a póker programok. Valószínűleg többet kellene tanulniuk az embertől, még a hibáinkat.
A táblás és kártyajátékok pontosan kidolgozott szabályaikkal, speciális célokkal a mesterségesintelligencia-kutatás kihívásokban bővelkedő, de nagyon izgalmas terepei. Sakk, dáma, go és a többiek mellett a logikailag ugyan egyszerűbb, de stratégiailag komplex póker szintén népszerű.
A hiányos információ problémája
Elsősorban abban különbözik tőlük, hogy nem-determinisztikus játék, mert a véletlen szerepe fontos, valamint hiányos (rejtett) információt is tartalmaz. A sakkban nincs ismeretlen, a pókerben a szabályok és a korlátok ellenére mindig van. Ez azért gond, mert a hézagos vagy nem megbízható információ kezelése, a bizonytalan feltételek közötti döntéshozás a számítástudomány egyik alapproblémája.
Nekünk embereknek ellenfelünk tekintete, arcmozgása árulkodik, egy botnak viszont semmit nem mond, semmiféle pluszadathoz nem jut hozzá. Mi hozzászoktunk a hiányzó információ kezeléséhez, számukra azonban monumentális kihívás. Ugyanez jellemzi az életet is – tárgyalás, alkudozás, aukció: mind, mind „nem teljes” információval folytatott játék.
„A póker csomó olyan helyzet mikrokozmosza, amellyel a valóságban találkozunk” – véli Jonathan Schaeffer, a kanadai Alberta Egyetem sakkprogramokkal foglalkozó kutatója.
A póker matematikája
A számítógépes környezet teljesen megváltoztatta a póker arculatát: bevett stratégiákkal hagytak fel, újak kerültek előtérbe, pörgősebbek, rövidebbek a menetek. Szoftveres szimulációban ideális gyakorolni, mert a stratégiák, nüánszok jobban látszódnak, és a legváltozatosabb lapkombinációkat többezer, akár millió meneten keresztül tesztelhetők. A programok, az állandóan a biztonságra ügyelőtől az ész nélkül hazardírozóig eltérő, színes játékos-archetípusokat „személyesítenek meg.”
A fejlesztők nagy része azonban nem szimpla gyakorlótársat, hanem több szakterület (MI, gazdaságtan stb.) eredményit alkalmazó valódi ellenfeleket tervez. A póker matematikájának mélységeit ismerő botok a legjobb stratégiákat keresik, a játék szépsége helyett a győzelem lebeg előttük. Többségük fizetős, főként havidíjas, de egyiket-másikat ingyen is letölthetjük. Folyamatosan fejlesztik őket, legjobbjaik blöffölni is tudnak, bár nem az a fő fegyverük: úgy programozzák őket, hogy a szabályoknak és a mindenkori lapleosztásnak megfelelően kiválasszák a legjobb stratégiát, majd annak megfelelően cselekedjenek.
Megmérettetések
Az első hivatalos ember-gép pókercsatára 2005-ben került sor, az ír-amerikai Phil „The Unabomber” Laak győzelmével. 2008 nyarán viszont az Alberta Egyetem és a Stoxpoker edző-honlap közös rendezésű las vegasi tornáján az egyetem által fejlesztett Polaris 3 győzelemmel, 2 vereséggel és 1 döntetlennel nyert.
2015. április-májusban a Carnegie Mellon Egyetem Claudiója a világ top 10 játékosai közül néggyel vívott meg egy sorozatot. 80 ezer leosztás után az emberek nyertek, de győzelmüket statisztikailag „nem-szignifikánsként”, inkább döntetlenként értékelte a szakma.
2006 óta a legkiválóbb botok nyaranta, 2011 óta pedig három pókerfajtában mérik össze tudásukat. Az utóbbi években hárman uralták a versenyeket. Egyikük természetesen az Alberta Egyetem, ahol tucatnyian írják a programokat. A Carnegie Mellon Tartanian botja szintén egyre masszívabb eredményeket ér el, míg a harmadik Eric Jackson független fejlesztésű Slumbotja. A legtöbb boton évekig dolgoznak, többmillió, ha nem milliárd játszmában vesznek részt.
A világverő is hibázik
2015-ben az albertaiak ismertették világverő Cepheusuk működését. Rengeteg gyakorlás után elérte a másodpercenkénti kétezer játszma sebességet, szinte az összes lehetséges lépést végigvette, stratégiájában egyre kevesebb lett a hibafaktor. A sajnálkozást minimalizáló algoritmussal dolgozva, minden játszma után visszatekint: mi történt volna, ha másként tette volna ezt és ezt. Így tanul a hibáiból.
Megmutatta, hogy a legbonyolultabb helyzetekre is található optimális stratégia. A kutatók szerint az algoritmus sok más forgatókönyvre szintén alkalmazható: part menti őrjáratra, orvosi kezelésre stb.
A javuló sakk, dáma, póker stb. programokkal nagy a kísértés, hogy kimondjuk: az ember előbb-utóbb esélytelen. Különösen akkor az, ha úgy próbál eljárni, mint a gépek. Ha például számításokba bonyolódik, amiben egyértelműen jóval lassabb…
Csakhogy a gépek is küszködnek egyes helyzetekben. Minél hosszabb ideig tart egy játszma, annál esélyesebbek, de ha pillanatokon belül kell döntésre vinni a dolgokat, könnyen elbuknak. Túl sok adat kell nekik, míg az ember kevés információból is következtet, hipotézist állít fel stb. Agresszivitásban, ellenféllel szembeni nyomásgyakorlásban szintén jobbak vagyunk. Ha túl nagy a nyomás, a gyakran elkapkodott, hirtelen döntéseket hoz és veszít a másik.
A legyőzhetetlen botnak ezt sem ártana elsajátítania. Minket utánozva tenné, és talán még a hibáinkat is másolná. Biztos okulna belőlük.