
L'intelligence artificielle bluffe au poker

Que des programmes informatiques puissent jouer au poker n'est pas nouveau. Aujourd'hui, une université américaine a mis au point une intelligence artificielle capable de tromper son adversaire humain par un coup de bluff.
Longtemps, on a pensé que le bluff était une affaire purement humaine. Un ordinateur ne pourra jamais nous mentir, nous tromper ou nous trahir. Mais dans les années 50, nous pensions aussi qu'il n'y aurait jamais d'ordinateur capable de jouer aux échecs. Nous nous sommes trompés sur ces deux points.
Il y a quelques jours, Noam Brown et Tuomas Sandholm de l'université Carnegie Mellon, en collaboration avec la division IA de Facebook, ont publié un article scientifique sur une intelligence artificielle appelée Pluribus. Pluribus est une IA de poker qui n'existait pas jusqu'à présent. Par rapport aux bots de poker précédents, elle ne se contente pas de calculer la probabilité de gagner, mais est capable de bluffer et de parier sur une mauvaise main. Pluribus ne considère cependant pas cette stratégie comme trompeuse ou mensongère. L'IA ne fait que miser sur cette solde pour rafler le plus de jetons possibles dans n'importe quelle situation.
Pluribus est un adversaire très puissant. Il est vraiment difficile de l'épingler sur n'importe quelle main.
Avant que Pluribus ne soit en mesure de le faire, les deux chercheurs ont dû lui apprendre à jouer au poker. Ils y sont parvenus en faisant jouer l'IA contre des copies d'elle-même. Ce processus de "self-play" est une technique courante pour apprendre des choses à des intelligences artificielles. Par "essai et erreur", Pluribus a joué des centaines de milliers de mains contre lui-même. Cette phase a duré à peine huit jours et a été exécutée sur un simple serveur 64 cœurs avec moins de 512 GB de RAM.
Pluribus est imbattable
Une fois que Pluribus a compris le concept du jeu, Brown et Sandholm ont dû lui inculquer la complexité supplémentaire de six adversaires. Ils ont dû apprendre à l'IA à se projeter dans l'avenir et à prédire les mouvements des adversaires. Si l'IA devait calculer cela jusqu'à la fin de la partie, cela serait beaucoup trop complexe et prendrait trop de temps. C'est pourquoi les développeurs ont conçu l'IA de manière à ce qu'elle n'anticipe que deux ou trois coups. Ainsi, Pluribus peut s'adapter à chaque fois à l'adversaire et ne prend qu'une fraction du temps nécessaire aux calculs.
Cela a fonctionné. Pluribus est actuellement capable de gagner contre n'importe quel joueur de poker dans le monde, car aucun humain n'est en mesure de rivaliser avec les capacités mathématiques rapides de l'IA. Même les professionnels confirmés du poker n'ont pas réussi à battre l'intelligence artificielle Pluribus lors d'un essai de 12 jours et 10 000 mains. Les développeurs donnent toutefois le feu vert : il n'est pas prévu d'utiliser Pluribus à des fins commerciales dans des salles de poker virtuelles. L'IA dans sa forme actuelle ne serait qu'une preuve de concept. Pluribus doit aider d'autres chercheurs à aborder le comportement des ordinateurs dans des situations complexes. Selon Brown et Sandholm, les applications possibles sont les voitures à conduite autonome dans le trafic urbain, la cybersécurité, la lutte contre la fraude ou encore les négociations financières.


Je profite de ma liberté sur ma moto, réveille mon instinct de chasseur à la pêche et laisse libre cours à mon imagination derrière la caméra. Je suis payé pour faire tout et n’importe quoi avec des jouets du soir au matin.