Comment deux robots ont appris à griller et à servir le hot-dog parfait

La liste des choses que les robots peuvent faire semble s’allonger de semaine en semaine. Ils peuvent faire du sport, nous aider à explorer l’espace et les fonds marins, prendre en charge certaines de nos ennuyeuses tâches quotidiennes et même assembler des meubles Ikea.

Ils peuvent maintenant ajouter une autre réalisation à la liste : faire griller et servir un hot-dog.

Cela semble être une tâche assez simple, et en ce qui concerne les grillades, les hot-dogs sont à peu près aussi faciles qu’ils le sont (avec, peut-être, des hamburgers ? Les hot-dogs exigent une plus grande rotation, mais il est plus facile de savoir quand ils sont cuits puisqu’ils sont de couleur plus claire).

Quelles sont les étapes à suivre ?

Chaque saucisse doit être placée sur le gril, tournée toutes les deux minutes pour une cuisson uniforme, retirée du gril lorsque vous jugez qu’elle est cuite, puis – si vous êtes le genre de personne qui fait un effort supplémentaire – placée dans un petit pain et habillée de ketchup, de moutarde, de cornichons et autres avant d’être servies.

Dans l’exercice de vos fonctions de grillmaster, vous savez mieux que quiconque qu’il ne faut pas laisser tomber les hot-dogs par terre, les laisser cuire trop longtemps sur le côté, les presser au point de les briser ou de les faire éclater, et tout autre mouvement d’amateur de la cuisson des hot-dogs.

Mais pour un robot, c’est beaucoup à comprendre, surtout s’il n’a aucune connaissance préalable de la cuisson des hot-dogs (ce qui n’est pas le cas de la plupart des robots).

Comme le décrit un article publié dans Science Robotics, une équipe de l’Université de Boston a programmé deux bras robotiques pour utiliser l’apprentissage par renforcement – une branche de l’apprentissage machine dans laquelle un logiciel recueille des informations sur son environnement puis en tire des enseignements en rejouant ses expériences et en incorporant des récompenses – pour cuire et servir des hot-dogs.

L’équipe a utilisé un ensemble de formules pour préciser et combiner les tâches (« prendre un hot-dog et le placer sur le grill »), répondre aux exigences de sécurité (« toujours éviter les collisions ») et intégrer des connaissances générales préalables (« vous ne pouvez pas prendre un autre hot-dog si vous en tenez déjà un »).

Baxter et Jaco – comme les deux robots ont été surnommés – ont été formés au moyen de simulations informatiques. Les auteurs de l’article ont insisté sur l’utilisation de ce qu’ils appellent un « langage de spécification formel » pour la formation du logiciel, dans le but de générer des descriptions de tâches faciles à interpréter. Dans l’apprentissage par renforcement, expliquent-ils, être capable de comprendre comment une fonction de récompense influence le processus d’apprentissage d’une IA est un élément clé pour comprendre le comportement du système – mais la plupart des systèmes n’ont pas cette qualité, et sont donc susceptibles d’être regroupés dans la  » boîte noire  » de l’IA.

Les décisions des robots tout au long du processus de préparation des hot-dogs – quand tourner un hot-dog, quand l’enlever du grill, etc. – sont, selon les auteurs,  » facilement interprétables dès le début car le langage est très similaire à l’anglais courant « .

En plus d’être un pas vers des systèmes d’IA plus explicables, Baxter et Jaco sont un autre exemple de robots de restauration rapide – suivant les traces de leurs homologues des secteurs des hamburgers et des pizzas – qui peuvent prendre en charge certaines tâches manuelles répétitives actuellement effectuées par des travailleurs humains. Au fur et à mesure que les capacités des robots s’amélioreront grâce à des progrès progressifs comme celui-ci, ils pourront prendre en charge des tâches supplémentaires.

Dans un avenir pas si lointain, peut-être qu’un robot s’occupera de vos grillades.

Via SingularityHubCreative Commons license CC BY-ND 4.0.

Laisser un commentaire

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.