Certains d’entre nous ont des maris ou épouses. Certains d’entre nous ont des partenaires. Certains d’entre nous ont des colocataires. Mais la plupart d’entre nous ont une AI ces jours-ci, que ce soit Siri sur notre iPhone, ou Alexa depuis un écho dans la cuisine.

Comment communiquer avec votre AI aussi intimement que vous pourriez le faire avec votre épouse, partenaire ou colocataire ? C’est la question que se posent des entreprises comme Google, Apple et Amazon depuis les dernières années. Mais c’est Mark Zuckerberg de Facebook qui a la meilleure réponse à ce jour: par le texte.

Au moins une partie du temps.

Dans un article exclusif, Daniel Terdiman a parlé de « Jarvis ». 3066732-inline-i-2-why-mark-zuckerbergs-home-ai-texts-as-much-as-it-speaks

Les paramètres de ce que nous appellerons « Jarvis, en référence à Marvel Entertainment ! sont assez simple. Comme le fondateur de Facebook dit :

Il n’y a pas un système de production qui est prêt à revenir à d’autres personnes. Mais si je ne pouvais pas construire un système qui puisse au moins faire ce que [Echo et Home peuvent], j’aurait probablement été assez déçu par moi-même.

Ces systèmes d’accueil permettent aux utilisateurs de contrôler tout ce qui est compatible dans leurs maisons : leurs lumières, les thermostats, les systèmes de sécurité, les centres de divertissement, et plus, simplement par la commande vocale. Ce qui est tout à fait standard: Apple essaie de faire la même chose avec Siri et HomeKit.

Mais l’observation clé de Zuckerberg n’est pas que les gens veulent être en mesure de contrôler leurs maisons par la voix. C’est qu’ils veulent aussi être en mesure de contrôler leurs maisons par le texte. Comme Terdiman a écrit:

 Zuckerberg a constaté que dans de nombreux autres cas, le texte est plus souhaitable, surtout quand il y a d’autres personnes autour, plus encore que la voix.

« Si je laisse quelqu’un à la porte… Ce n’est pas pertinent pour les gens autour de moi, » [Zuckerberg] dit, « donc je préfère de loin simplement le texter. »

À l’heure actuelle, les entreprises supposent que la voix sera finalement le système d’exploitation de la domotique. Ils envisagent l’AI comme une sorte d’invisible serviteur colocataire, quelqu’un que nous harcèlerons à haute voix quand nous aurons un peu trop froid, ou lorsque nous voudrons mettre une musique différente. Et quand nous voudrons les commander, nous exprimerons nos demandes à voix haute, asservis technologiquement dans l’espoir d’être entendu et d’être compris, sinon obéit.

C’est juste, mais c’est la moitié de l’idée. L’idée clé Zuckerberg est là : il y aura des moments où nous ne voudrons pas parler et commander à voix haute. Il y aura des moments de commandement plus soft. Un moments où vous discutez avec vos convives, et on sonne à la porte. Comment préférez-vous être interrompu ? Par un vacarme assourdissant qui perturbe tout le monde ? Ou un buzz insistant sur votre téléphone auquel vous pouvez répondre avec la même efficacité qu’un sms ?

La vérité est, en prenant une IA dans notre maison, il s’agit d’un partenariat, ni plus ni moins. Et nous ne communiquons pas toujours à nos partenaires par la voix. Si je suis assis sur le canapé avec mon conjoint, oui, nous nous parlons, mais surtout en présence d’autres, nous allons nous envoyer des sms, parce que le texte est l’interface utilisateur invisible dans notre maison. Il est la couche cachée que nous utilisons pour dire à l’autre de baisser le feu, de vérifier la porte, de changer la musique, ou oui – envoyer parfois des mots doux quand les autres sont dans la salle.

3066732-inline-i-1-why-mark-zuckerbergs-home-ai-texts-as-much-as-it-speaks

Son Jarvis n’est pas la plus intelligent des AI, il est le meilleur moyen. L’article de Terdiman montre plusieurs exemples d’AI de Zuckerberg à défaut de comprendre les commandes vocales du fondateur Facebook. Mais ce serait vrai de Siri, Alexa ou Google, aussi. Est-ce qu’il n’est pas étrange de parler en l’air ?

Zuckerberg a des mots sages sur la raison pour laquelle une ligne de commande vocale seule ne fonctionne pas encore avec les AI:

Si vous vous entraînez un système d’apprentissage de la machine sur les données Google de personnes parlant à un moteur de recherche, il se produira relativement pire sur Facebook lorsqu’il s’agira de comprendre les gens qui parlent à des personnes réelles. Dans le cas de Jarvis, la formation d’une AI à laquelle vous parlez aura une courte portée et des limites. Ces systèmes sont plus spécialisés qu’il n’y paraît, et cela implique que nous sommes plus loin d’avoir un système général que cela puisse paraître.

En d’autres termes, les gens parlent entre eux en utilisant une syntaxe différente de celles que nous utilisons pour parler aux AIs. C’est le problème de la poule et de l’œuf : quand les AI parleront comme les gens, les AI n’auront pas suffisamment de données pour comprendre comment parler aux gens comme des gens.

En attendant, ce seront les messages texte – en particulier dans les situations d’ambiguïté – qui font le plus de sens. Nous avons tous passé la plus grande partie de la décennie à communiquer avec l’interface de recherche de texte comme Google. Nous savons comment fonctionne le texte et les machines, et le milieu textuel nous entraîne à entrer dans une syntaxe plus « machinique ».
Mais parler aux machines ? Passez quelques minutes hésitantes avec Alexa, et prendre le risque de parler bêtement… Nous sommes tout simplement pas encore prêt. Et à cause de cela, les AI ne sont pas encore complètement entrées dans nos maisons.

Publicités

2 commentaires »

Laisser un commentaire

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.