
Künstliche Intelligenz blufft beim Poker

Dass Computerprogramme Poker spielen können, ist nichts Neues. Jetzt hat eine US-Universität eine künstliche Intelligenz entwickelt, die seinen menschlichen Gegenspieler mit einem Bluff täuschen kann.
Lange dachte man, dass Bluffen eine rein menschliche Sache ist. Ein Computer wird uns nicht belügen, betrügen oder hintergehen können. In den 50er Jahren dachten wir aber auch, dass es niemals einen Computer geben wird, der Schach spielen kann. Wir täuschten uns in beiden Belangen.
Vor ein paar Tagen veröffentlichten Noam Brown und Tuomas Sandholm von der Carnegie Mellon University in Zusammenarbeit mit der KI-Abteilung von Facebook einen wissenschaftlichen Artikel über eine künstliche Intelligenz namens Pluribus. Pluribus ist eine Poker-KI, die es so bis anhin noch nicht gab. Im Vergleich zu bisherigen Poker-Bots berechnet sie nicht nur die Wahrscheinlichkeit eines Gewinnes, sondern ist in der Lage zu bluffen und auf eine schlechte Hand zu wetten. Pluribus sieht diese Strategie jedoch nicht als trügerisch oder lügnerisch an. Die KI setzt lediglich auf diese Aktion, um in jeder Situation die meisten möglichen Chips abzustauben.
Pluribus ist ein sehr starker Gegenspieler. Es ist wirklich schwierig, ihn an irgendeiner Hand festzunageln.
Bevor Pluribus dazu in der Lage war, mussten ihm die beiden Forscher das Pokerspielen beibringen. Dies erreichten sie, indem sie die KI gegen Kopien von sich selbst antreten liessen. Dieser Self-Play-Prozess ist eine gängige Technik, um künstlichen Intelligenzen Dinge beizubringen. Durch «Try and Error» hat Pluribus Hunderttausende von Händen gegen sich selbst gespielt. Diese Phase dauerte gerade mal acht Tage und wurde auf einem simplen 64-Core-Server mit weniger als 512 GB RAM ausgeführt.
Pluribus ist unschlagbar
Nachdem Pluribus das Spielkonzept begriffen hatte, mussten Brown und Sandholm ihm die zusätzliche Komplexität von sechs Gegenspielern einflössen. Sie mussten der KI beibringen, wie sie in die Zukunft blicken und die Züge der Gegenspieler vorhersagen kann. Müsste die KI dies bis zum Ende der Partie durchrechnen, wäre dies viel zu komplex und würde zu viel Zeit beanspruchen. Deshalb haben die Entwickler die KI so konzipiert, dass sie nur zwei oder drei Züge vorausschaut. Somit kann sich Pluribus immer wieder auf’s Neue den Gegenspielern anpassen und benötigt einen Bruchteil der benötigten Zeit für die Berechnungen.
Das hat funktioniert. Pluribus ist momentan in der Lage gegen jeden Pokerspieler weltweit zu gewinnen, da kein Mensch in der Lage ist, gegen die schnellen mathematischen Fähigkeiten der KI anzutreten. Selbst eingefleischte Poker-Profis haben in einem Test über 12 Tage und 10 000 Hände keinen Stich gegen die künstliche Intelligenz Pluribus. Die Entwickler geben jedoch Entwarnung: Es gibt keine Pläne, Pluribus kommerziell in virtuellen Pokerräumen zu nutzen. Die KI in der jetzigen Form sei lediglich ein Proof of Concept. Pluribus soll anderen Forschern helfen, das Computerverhalten in komplexen Situationen anzugehen. Mögliche Anwendungszwecke sind gemäss Brown und Sandholm selbstfahrende Autos im städtischen Verkehr, Cybersecurity, Betrugsbekämpfung oder auch Finanzverhandlungen.


Bezahlt werde ich dafür, von früh bis spät mit Spielwaren Humbug zu betreiben.