L’informaticienne qui forme l’IA à penser par analogies

Un article de John Pavlus pour Quantamagazine :

« Melanie Mitchell travaille sur les esprits numériques depuis des décennies. Elle dit qu’ils ne seront jamais vraiment comme les nôtres tant qu’ils ne pourront pas faire d’analogies.

Le livre Gödel, Escher, Bach, récompensé par le prix Pulitzer, a inspiré des légions d’informaticiens en 1979, mais peu l’ont été autant que Melanie Mitchell. Après avoir lu ce tome de 777 pages, Mme Mitchell, professeur de mathématiques dans un lycée de New York, a décidé qu’elle devait se consacrer à l’intelligence artificielle. Elle a rapidement retrouvé l’auteur du livre, le chercheur en IA Douglas Hofstadter, et l’a convaincu de lui offrir un stage. À l’époque, elle n’avait suivi qu’une poignée de cours d’informatique, mais il semblait impressionné par son audace et ne se souciait pas de ses diplômes.

Mme Mitchell a préparé une demande d’admission aux études supérieures « à la dernière minute » et a rejoint le nouveau laboratoire d’Hofstadter à l’université du Michigan à Ann Arbor. Les deux hommes passent les six années suivantes à collaborer étroitement sur Copycat, un programme informatique qui, selon les termes de ses co-créateurs, est conçu pour « découvrir des analogies perspicaces, et ce d’une manière psychologiquement réaliste ».

Les analogies trouvées par Copycat se situaient entre de simples motifs de lettres, à l’instar des analogies utilisées dans les tests standardisés. Un exemple : « Si la chaîne ‘abc’ se transforme en chaîne ‘abd’, en quoi la chaîne ‘pqrs’ se transforme-t-elle ? » Hofstadter et Mitchell pensaient que la compréhension du processus cognitif de l’analogie – comment les êtres humains établissent des connexions abstraites entre des idées, des perceptions et des expériences similaires – serait cruciale pour débloquer une intelligence artificielle de type humain.

M. Mitchell soutient que l’analogie peut aller beaucoup plus loin que la correspondance de modèles à la manière d’un examen. « Il s’agit de comprendre l’essence d’une situation en la mettant en correspondance avec une autre situation déjà comprise », a-t-elle déclaré. Si vous me racontez une histoire et que je dis : « Oh, il m’est arrivé la même chose », il ne m’est pas arrivé la même chose qu’à vous, mais je peux établir une correspondance qui rend la situation très analogue. C’est quelque chose que nous, les humains, faisons tout le temps sans même nous en rendre compte. Nous nageons constamment dans cette mer d’analogies. »

En tant que professeur Davis de complexité à l’Institut Santa Fe, Mme Mitchell a élargi ses recherches au-delà de l’apprentissage automatique. Elle dirige actuellement le projet « Foundations of Intelligence in Natural and Artificial Systems » du SFI, qui organisera une série d’ateliers interdisciplinaires au cours de l’année prochaine pour examiner comment l’évolution biologique, le comportement collectif (comme celui des insectes sociaux tels que les fourmis) et un corps physique contribuent tous à l’intelligence. Mais le rôle de l’analogie est plus important que jamais dans son travail, en particulier dans le domaine de l’intelligence artificielle, dont les avancées majeures de la dernière décennie ont été largement alimentées par les réseaux neuronaux profonds, une technologie qui imite l’organisation en couches des neurones dans le cerveau des mammifères.

« Les réseaux neuronaux de pointe d’aujourd’hui sont très bons dans certaines tâches, mais ils sont très mauvais lorsqu’il s’agit de transférer dans une autre situation ce qu’ils ont appris dans un autre type de situation, ce qui est l’essence même de l’analogie.

Quanta s’est entretenu avec Mme Mitchell sur la façon dont l’IA peut faire des analogies, sur ce que le domaine a appris à ce sujet jusqu’à présent et sur les prochaines étapes à franchir. L’entretien a été condensé et modifié pour plus de clarté.

Pourquoi l’analogie est-elle si importante pour l’IA ?

Il s’agit d’un mécanisme fondamental de la pensée qui aidera l’IA à se hisser là où nous voulons qu’elle soit. Certains disent que la clé de l’IA réside dans sa capacité à prédire l’avenir, à faire preuve de bon sens ou à retrouver des souvenirs utiles dans une situation donnée. Mais dans chacune de ces choses, l’analogie est très centrale.

Par exemple, nous voulons des voitures autonomes, mais l’un des problèmes est que si elles sont confrontées à une situation légèrement différente de celle pour laquelle elles ont été formées, elles ne savent pas quoi faire. Comment les humains savent-ils quoi faire dans des situations qu’ils n’ont jamais rencontrées auparavant ? Eh bien, nous utilisons des analogies avec nos expériences précédentes. Et c’est quelque chose que nous aurons besoin que ces systèmes d’IA dans le monde réel soient également capables de faire.

Mais vous avez également écrit que l’analogie est « un domaine peu étudié en IA ». Si c’est si fondamental, pourquoi est-ce le cas ?

L’une des raisons pour lesquelles les gens ne l’ont pas autant étudiée est qu’ils n’ont pas reconnu son importance essentielle pour la cognition. Se concentrer sur la logique et la programmation des règles de comportement – c’est ainsi que fonctionnaient les premières IA. Plus récemment, les gens se sont concentrés sur l’apprentissage à partir d’un grand nombre d’exemples, puis ont supposé qu’ils seraient capables d’induire des choses qu’ils n’avaient jamais vues auparavant en utilisant uniquement les statistiques de ce qu’ils avaient déjà appris. Ils espéraient que les capacités de généralisation et d’abstraction découleraient en quelque sorte des statistiques, mais cela n’a pas fonctionné aussi bien que prévu.

Vous pouvez montrer à un réseau neuronal profond des millions d’images de ponts, par exemple, et il pourra probablement reconnaître une nouvelle image d’un pont sur une rivière ou autre. Mais il ne pourra jamais abstraire la notion de « pont » pour, disons, notre concept de réduction de l’écart entre les sexes. Il s’avère que ces réseaux n’apprennent pas à abstraire. Il y a quelque chose qui manque. Et les gens ne s’en rendent compte que maintenant.

(…)

Lire la suite sur Quantamagazine

Laisser un commentaire

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.