La dernière avancée de DeepMind se comporte d’une manière très surprenante. Les autres systèmes d’IA devraient être tout aussi bizarres.

Le dernier programme d’AI développé par DeepMind n’est pas seulement brillant et remarquablement flexible, il est aussi assez bizarre.

DeepMind a publié cette semaine un article décrivant un programme de jeu qu’il a développé qui s’est avéré capable de maîtriser les échecs et le jeu japonais Shōgi, ayant déjà la maîtrise du jeu de Go.

Demis Hassabis, le fondateur et CEO de DeepMind et joueur d’échecs lui-même, a présenté plus de détails sur le système, appelé Alpha Zero, lors d’une conférence d’IA en Californie jeudi. Le programme faisait souvent des coups qui semblaient impensable à un joueur d’échecs humain.

« Il ne joue pas comme un humain, et il ne joue pas comme un programme », a déclaré Hassabis lors de la conférence Neural Information Processing Systems (NIPS) à Long Beach. « Il joue d’une troisième façon, presque extraterrestre. »

En plus de montrer à quel point les programmes d’apprentissage machine peuvent être performants pour une tâche spécifique, cela montre que l’intelligence artificielle peut être tout à fait différente de l’intelligence humaine. Au fur et à mesure que l’IA se banalisera, nous devrons peut-être être conscients de ce comportement  » étranger « .

Alpha Zero est une version plus générale d’AlphaGo, le programme développé par DeepMind pour jouer au jeu de société Go. En 24 heures, Alpha Zero a appris à jouer aux échecs assez bien pour battre l’un des meilleurs programmes d’échecs existants.

« Ce qui est également remarquable, cependant, » explique Hassabis, « c’est que cela fait parfois des sacrifices apparemment insensés, comme sacrifier un fou et une reine pour exploiter un avantage positionnel qui l’a mené à la victoire. De tels sacrifices de pièces de grande valeur sont normalement rares. Dans un autre cas, le programme a déplacé sa reine au coin du plateau, un tour très bizarre avec une valeur de positionnement surprenante. « C’est comme des échecs d’une autre dimension », dit Hassabis.

Hassabis spécule que parce qu’Alpha Zéro s’auto-enseigne, il a intérêt à ne pas suivre l’approche habituelle qui consiste à attribuer une valeur aux pièces et à essayer de minimiser les pertes. « Peut-être que notre conception des échecs a été trop limitée », a-t-il dit. « Ça pourrait être un moment important pour les échecs. On peut ajouter cette dimansion à notre propre jeu. »

Le jeu d’échecs a une longue histoire en intelligence artificielle. Les meilleurs programmes, élaborés et perfectionnés au fil des décennies, intègrent d’énormes quantités d’intelligence humaine. Bien qu’en 1996, Deep Blue d’IBM a battu le champion du monde de l’époque, ce programme, comme les autres programmes d’échecs conventionnels, nécessitait une programmation manuelle soignée.

L’AlphaGo Zero AI révolutionnaire de DeepMind est maintenant un joueur polyvalent.

L’AlphaGo original, conçu spécialement pour Go, a été un grand succès parce qu’il était capable d’apprendre à jouer un jeu extrêmement complexe et difficile à enseigner, nécessitant un sens instinctif des positions. AlphaGo a maitrisé Go en ingérant des milliers de jeux d’exemple et en pratiquant contre une autre version de lui-même. Il y est parvenu en partie en formant un vaste réseau neuronal à l’aide d’une approche connue sous le nom de renforcement de l’apprentissage, qui est modelée sur la façon dont les animaux semblent apprendre.

(le nombre de combinaisons possibles au jeu de Go)

DeepMind a depuis lors fait la démonstration d’une version du programme, appelée AlphaGo Zero, qui apprend sans jeux d’exemple, mais en se basant uniquement sur l’auto-jeu. Alpha Zero s’améliore encore plus en montrant que le même programme peut maîtriser trois types différents de jeux de société.

Les réalisations d’Alpha Zero sont impressionnantes, mais il pratique beaucoup plus de parties d’entraînement qu’un maître d’échecs humain. Hassabis dit que c’est peut-être parce que les humains tirent profit d’autres formes d’apprentissage, comme la lecture sur la façon de jouer au jeu et dans le fait de regarder les autres jouer.

Néanmoins, certains experts soulignent que les capacités du programme, bien que remarquables, devraient être mises en contexte. S’exprimant après Hassabis, Gary Marcus, professeur à l’Université de New York, a déclaré qu’une grande partie de la connaissance humaine est entrée dans la construction de l’Alpha Zéro. Et il suggère que l’intelligence humaine semble impliquer certaines capacités innées, comme la capacité intuitive de développer le langage.

Josh Tenenbaum, professeur au MIT qui étudie l‘intelligence humaine, a dit que si nous voulons développer une véritable intelligence artificielle au niveau humain, nous devrions étudier la flexibilité et la créativité des humains. Il a cité, entre autres exemples, l’intelligence de Hassabis et de ses collègues dans la conception, la conception et l’élaboration du programme. C’est presque aussi impressionnant qu’une reine placée dans le coin du plateau de jeu.

Laisser un commentaire

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.