Publicités

Pourquoi le poker aura tout à voir avec l’intelligence artificielle

Pourquoi le poker aura tout à voir avec l’intelligence artificielle

Jouer au poker implique de traiter avec une information imparfaite, ce qui rend le jeu très complexe, et se rapproche remarquablement de nombreuses situations du monde réel.

Comme le grand Kenny Rogers l’a dit une fois, un bon joueur doit savoir quand hold ’em et savoir quand se fold’ em. Au Casino Rivers à Pittsburgh cette semaine, un programme informatique appelé Libratus peut enfin prouver que les ordinateurs peuvent faire mieux que tout autre joueur humain.

Libratus joue à des milliers de jeux seul, ou à deux joueurs, au no-limit Texas hold’em contre plusieurs joueurs experts en poker. Maintenant, à un peu plus de la moitié du concours qui dure 20 jours, Libratus est en hausse de près de 800 000 $ par rapport à ses adversaires humains. Donc la victoire, bien loin d’être garantie, pourrait bien être dans les cartes.

Une victoire pour libratus serait une grande réussite dans l’intelligence artificielle. Le poker exige le raisonnement et l’intelligence, ce qui le rendait difficile à imiter pour les machines. Le poker est fondamentalement différent des dames, des échecs, ou du Go, parce que la main d’un adversaire reste tout le temos cachée. Dans les jeux d' »‘information imparfaite, « il est extrêmement compliqué de comprendre la stratégie idéale étant donné que toutes les approches possibles de votre adversaire peuvent être prises. Et no-limit Texas hold’em est particulièrement difficile, car un adversaire pourrait essentiellement parier n’importe quel montant.

« Le poker a été l’un des jeux les plus difficiles pour l’ IA à craquer » , dit Andrew Ng, directeur scientifique de Baidu. « Il n’y a aucun mouvement optimal unique, mais un joueur d’IA peut randomiser ses actions de manière à cacher à ses adversaires s’il est en train de bluffer. »

Libratus a été créé par Tuomas Sandholm, professeur au département de science informatique à la CMU, et par son étudiant Noam Brown. Sandholm, un expert de la théorie des jeux et de l’ IA, qui a émigré de Finlande pour son doctorat, dit qu’il est étonnant que les humains soient en mesure de déjouer les ordinateurs depuis si longtemps. « Ce qui prouve que ce sont des pros, » dit-il. « De tous ces jeux que l’ IA a abordé, le poker est le seul où l’IA n’a pas atteint la performance de surpasser l’humaine. »

Les chercheurs en IA utilisent la théorie des jeux, ou les mathématiques pour la prise de décision stratégique, pour trouver la meilleure stratégie étant donné les diverses incertitudes, connues comme un équilibre. Parce que les possibilités sont si vastes, cela implique généralement une certaine forme de déductions.

« Que ce soit un mouvement bon ou pas dépend de choses que vous ne pouvez pas observer, » dit Vincent Conitzer, professeur à l’Université Duke, qui enseigne la théorie IA du jeu. « Il en résulte également un besoin d’être imprévisible. Si vous ne bluffez jamais, vous n’êtes pas un bon joueur. Si vous bluffez toujours, vous n’êtes pas un bon joueur. La théorie des jeux vous indique comment randomiser votre jeu d’une manière qui est, dans un sens, optimal « .

L’année dernière, Sandholm a dirigé l’élaboration d’un programme de jeu de poker, appelé Claudico, qui a été largement battu lors d’une partie contre plusieurs joueurs de poker professionnels. Il explique que Libratus utilise plusieurs nouvelles avancées pour atteindre un tel niveau de jeu. Cela inclut une nouvelle technique d’équilibre d’approximation, Sandholm dit, ainsi que plusieurs nouvelles méthodes d’analyse des résultats possibles quand les cartes sont révélées à des étapes ultérieures d’un jeu. Cette analyse de fin de jeu est informatiquement très difficile, et est effectuée lors de chaque match au Pittsburgh Supercomputing Center, un centre exploité par la CMU et l’Université de Pittsburgh.

Les progrès dans l’ apprentissage de la machine et l’IA ont vu un certain nombre de programmes de jeu de jeu surhumaine émerger récemment. L’an dernier, les chercheurs de DeepMind, une filiale d’Alphabet, ont mis au point un programme capable de battre l’un des meilleurs joueurs de Go au monde. Cette réalisation a été spectaculaire parce que le Go est extrêmement complexe, et parce qu’il est difficile de mesurer les progrès dans le jeu.

Quelques différents groupes de recherche se concentrent sur la lutte contre le poker. Une autre équipe universitaire de l’Université d’Alberta au Canada, de l’Université Charles et de l’ Université technique tchèque en République tchèque, a récemment mis au point un programme, appelé DeepStack, qui a déjà battu plusieurs joueurs professionnels en heads-up No Limit Texas hold’em (voir « Poker est le dernier jeu gagné contre l’AI« ). Cependant, Sandholm dit, les acteurs impliqués dans le match contre Libratus sont beaucoup plus forts, et jouent beaucoup plus de mains contre la machine, ce qui devrait assurer une plus grande signification statistique pour le résultat.

Les techniques utilisées pour construire un poker-bot intelligent pourrait avoir de nombreuses applications dans le monde réel. La théorie des jeux a déjà été appliquée pour la recherche sur les attaques et la cybersécurité de brouillage, l’orientation automatique pour le service de taxi, et la planification de robot, dit Sam Ganzfried , qui a été impliqué dans le développement de Claudico et est maintenant professeur adjoint à l’Université internationale de Floride à Miami.

Cependant, malgré les triomphes de libratus cette semaine, cela ne signifie pas que les humains ne méritent plus leur place à la table à cartes. La version multijoueur de no-limit Texas hold’em ne peut pas être maîtrisée en utilisant les techniques employées par Libratus.

TechnologyReview

Publicités

Laisser un commentaire

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.

%d blogueurs aiment cette page :