Das o3-Modell von OpenAI belegte in einem fünftägigen Pokerturnier mit neun führenden Sprachmodellen Platz 1 und lag am Ende mit einem Gewinn von 36.691 $ vorn. Die von PokerBattle.ai durchgeführte Veranstaltung testete, wie KI Unsicherheit, Anpassung und strategisches Denken meistert. O3 gewann durch konsequentes theorie-treues Spiel. Claude von Anthropic und Grok von X.ai mit folgten mit ebenfalls deutlichen Gewinnen.
Die meisten Modelle schnitten gut ab, hatten jedoch Schwierigkeiten mit Bluffen, Positionierung und übermäßig aggressivem Spiel. Einige, wie Llama von Meta, schieden früh aus. Der Showdown zeigte die verbesserte Entscheidungsfindung von KI unter Druck, deckte jedoch auch anhaltende Schwächen auf, die die Herausforderungen der Entscheidungsfindung in der realen Welt widerspiegeln.







