De AI-oorlog aan de pokertafel en wat de winst van OpenAI ons echt vertelt
In dit artikel:
Negen geavanceerde AI-modellen streden vijf dagen lang, continu, in een online No-Limit Hold’em cashgame-onderzoek dat 3.799 handen besloeg. De grootste winnaar was OpenAI o3, die ruim $36.691 aan speelgeld bijschreef. Grok 4 (van Elon Musk) leidde lange tijd maar eindigde als derde; Meta’s LLAMA 4 verloor zijn complete $100.000-bankroll.
Het experiment onderscheidde zich omdat de bots niet als klassieke pokeralgoritmes werden ingezet, maar werden getraind met mensgerichte studiematerialen: pokerboeken, blogs en analyses. Ze mochten aantekeningen maken en hun spel aan tegenstanders aanpassen, waardoor hun speelstijl meer op menselijk strategisch redeneren leek dan op puur rekenwerk. Dat maakte de battle een test van adaptiviteit en onzekerheidsbeheer — aspecten die schaken of Go niet in dezelfde mate bevatten.
De speelstijlen verschilden sterk. Meta LLAMA 4 bleek extreem ongeduldig: met een VPIP van meer dan 60% speelde het ruim de helft van alle handen en raakte daardoor langzaam zijn geld kwijt. OpenAI o3 toonde juist geduld en selectiviteit, en sloeg toe op cruciale momenten; een beslissende hand was pocket azen tegen pocket vrouwen van Gemini 2.5 Pro, waarbij OpenAI maximale uitbetaling kreeg. Gemini verdedigde achteraf zijn keuze als een berekende call op basis van gepolariseerde ranges en pot odds, maar kreeg net niet het geluk van z’n kant.
Organisator Max Pavlov waarschuwde dat 3.799 handen te weinig zijn om definitieve conclusies te trekken over welke AI “beter” is, maar het evenement illustreert wel dat verschillende LLM’s fundamenteel anders strategisch denken. Tegelijk riep de demonstratie kritiek op: openbaar tonen hoe sterk moderne AI’s in poker zijn kan misbruik aanmoedigen door illegale bots — een al bestaand probleem bij online pokerplatforms — en zo de wapenwedloop tussen bot-ontwikkelaars en beveiliging versnellen.
Voor de techwereld is de uitkomst relevant omdat poker een spel van onvolledige informatie, psychologie en misleiding is. Dat taalmodellen, getraind op tekst, effectief kunnen navigeren in zulke omgevingen suggereert bredere toepassingsmogelijkheden — van financiële markten tot onderhandelingen en autonome besluitvorming. Het experiment verschilt hiermee van eerdere gespecialiseerde pokerbots (zoals Libratus en Pluribus), die vooral op game-theoretische optimalisatie gericht waren; LLM’s gebruiken kennis en adaptieve redenering op nieuw ingestelde manieren.
Volgende uitdaging die ter discussie staat: een heads-up tussen Grok 4 en pokerlegende Phil Galfond, bedoeld als ultieme proef tussen menselijke finesse en AI-strategie. Voor nu toont de AI Poker Battle vooral aan dat moderne taalmodellen niet alleen woorden, maar ook complexe, risicogebaseerde beslissingen steeds beter kunnen hanteren.