Poker ist ein trügerisch einfaches Spiel. Die Spielregeln sind zwar einfach, doch im Gegensatz zu Schach sind nicht alle Karten offen und jeder Spieler verbirgt Informationen vor den jeweiligen Kontrahenten. Dazu kommt das Element des Zufalls: die Karten werden pro Spielrunde neu gemischt und an die Spieler ausgeteilt. Die Kombination von Zufall und verdeckter Information macht Poker zu einer grossen Herausforderung für die künstliche Intelligenz.
Das Ziel der vorliegenden Bachelorarbeit ist es, bestehende Algorithmen der künstlichen Intelligenz (KI) in einem Spiel mit imperfekter Information - namentlich in der Pokervariante Texas Hold’em - zu implementieren und sowohl theoretisch als auch empirisch zu vergleichen. Dazu wird eine Simulation im Rahmen eines Vorprojektes entwickelt, welche die Gegenüberstellung mehrerer Algorithmen erlaubt.
Diese Arbeit konzentriert sich auf die beiden KI-Algorithmen Counterfactual Regret Minimization (CFR) und Opponent Modelling (OM). Der CFR-Algorithmus abstrahiert das reale Spiel und nähert eine verlustfreie Strategie an, indem er viele Male gegen sich selbst spielt und sich dabei stetig verbessert. Die Idee dieser Abstrahierung besteht darin, das originale Spiel M in einer signifikant kleineren Form M’ abzubilden, das so entstandene Spiel mit einer Strategie S’(M’) zu lernen und schliesslich das Resultat des Trainings auf M anzuwenden. Die optimale Strategie S(M) bleibt währenddessen unbekannt und wird idealerweise von der Strategie S’(M’) möglichst angenähert (Siehe Bild 1). Wogegen der OM-Algorithmus versucht, Schwachstellen im Spiel des Gegners zu identifizieren und darauf mit Konterstrategien zu reagieren.
Beide Algorithmen werden erfolgreich umgesetzt und anschliessend miteinander verglichen. Bei der Direktbegegnung, sowie einem Wettkampf (Siehe Bild 2) mit anderen primitiven Agenten dominiert der OM-Algorithmus jeden seiner Kontrahenten. Der CFR-Algorithmus ist stark abstrahiert und belegt vermutlich deshalb nur den zweiten Platz. Schliesslich folgt ein qualitativer Vergleich, bei dem ein menschlicher Spieler selbst gegen die entwickelten Algorithmen spielt. Dabei ist der OM-Algorithmus einfacher zu bezwingen, obwohl dieser im Wettkampf besser abgeschnitten hat.