Pensez à la façon dont vous lisez. Vous dites chaque mot à voix haute dans votre tête ?

C’est un processus appelé vocalisation interne ou sous-vocalisation, et lorsque vous dites des mots dans votre tête, il y a de minuscules mouvements des muscles autour de vos cordes vocales et de votre larynx. Depuis des décennies, les gens sont fascinés par ce phénomène, aussi appelé « discours silencieux« , principalement par la manière d’arrêter de le faire pour lire plus vite. Mais la vocalisation interne a une nouvelle application qui pourrait changer notre façon d’interagir avec les ordinateurs.

(sur Internet vous trouverez assez peu de recherches sur le sujet, c’est dire que c’est peut-être bien révolutionnaire)

 

[Photo : Lorrie LeJeune/MIT]
Les chercheurs du MIT Media Lab ont créé un prototype pour un appareil que vous portez sur votre visage qui peut détecter les petits changements qui se produisent lorsque vous sous-vocalisez avec les muscles qui vous aident à parler. Cela signifie que vous pouvez sous-vocaliser un mot, l’accessoire peut le détecter, et le traduire en une commande significative pour un ordinateur. Ensuite, l’ordinateur connecté au portable peut effectuer une tâche pour vous, et communiquer avec vous par conduction osseuse.
Qu’est-ce que ça veut dire ? Fondamentalement, vous pourriez penser une expression mathématique comme 1567 + 437 et l’ordinateur pourrait vous dire la réponse (2004) en conduisant des ondes sonores à travers votre crâne.

 

 

 

L’appareil et la plate-forme technologique correspondante s’appelle AlterEgo, et est un prototype de la façon dont des machines d’intelligence artificielle pourraient communiquer avec nous dans le futur. Mais les chercheurs se concentrent sur une école de pensée particulière autour de l’IA qui met l’accent sur la façon dont l’IA peut être développée pour augmenter la capacité humaine, plutôt que de remplacer les gens.

« Nous avons pensé qu’il était important de travailler sur une vision alternative, où les gens peuvent faire une utilisation très facile et transparente de toute cette intelligence informatique », dit Pattie Maes, professeur de technologie des médias et chef du groupe Interfaces fluides du Media Lab. « Ils n’ont pas besoin d’être en compétition, ils peuvent collaborer avec les IA d’une manière transparente. »

Les chercheurs sont très déterminés à souligner qu‘AlterEgo n’est pas la même chose qu’une interface cerveau-ordinateur – une technologie pas encore possible dans laquelle un ordinateur peut lire directement les pensées de quelqu’un.

En fait, AlterEgo a été délibérément conçu pour ne pas lire l’esprit de son utilisateur.

« Nous pensons qu’il est absolument important qu’une interface quotidienne n’envahisse pas les pensées privées de l’utilisateur « , déclare Arnav Kapur, doctorant dans le groupe Interfaces fluides. « Il n’a pas d’accès physique à l’activité cérébrale de l’utilisateur. Nous pensons qu’une personne devrait avoir un contrôle absolu sur les informations à transmettre à une personne ou à un ordinateur. »

Utiliser la vocalisation interne comme moyen de donner aux gens une façon privée et naturelle de communiquer avec un ordinateur qui n’exige pas qu’ils parlent du tout est une idée intelligente qui n’a pas de précédent dans la recherche sur l’interaction homme-machine.

Kapur, qui dit avoir appris la vocalisation interne en regardant des vidéos YouTube sur la vitesse de lecture, a testé l’idée en plaçant des électrodes à différents endroits sur les visages et les gorges des sujets testés (son frère était son premier sujet). Au fil du temps, Kapur a pu trouver des signatures de basse amplitude et de basse fréquence qui correspondaient à différents mots sous-vocalisés. L’étape suivante consistait à former un réseau neuronal pour différencier les signatures afin que l’ordinateur puisse déterminer avec précision quel mot quelqu’un vocalise.

Mais Kapur ne s’intéressait pas seulement à ce qu’un ordinateur puisse entendre ce que vous dites dans votre tête – il voulait aussi qu’il puisse communiquer avec vous.

C’est ce qu’on appelle une interface en boucle fermée, où l’ordinateur agit presque comme un confident dans votre oreille.

En utilisant l’audio de conduction osseuse, qui vibre contre votre os et vous permet d’entendre l’audio sans avoir un casque à l’intérieur de votre oreille, Kapur a créé un accessoire portable qui pouvait détecter votre discours silencieux et vous répondre.

L’étape suivante consistait à voir comment la technologie pouvait être appliquée. Kapur a commencé par la construction d’une application arithmétique, la formation du réseau neuronal pour reconnaître les chiffres de un à neuf et une série d’opérations comme l’addition et la multiplication. Il a construit une application qui permet au porteur de poser des questions de base à Google, comme le temps qu’il fera demain, l’heure qu’il est ou même l’endroit où se trouve un restaurant en particulier.
Kapur se demandait également si AlterEgo pouvait permettre à une IA de s’installer dans votre oreille et vous aider à prendre des décisions.

Inspiré par l’IA AlphaGo de Google, qui a battu le champion humain de Go en mai 2017, Kapur a construit une autre application qui pourrait conseiller un joueur humain sur l’endroit où se déplacer dans les parties de Go ou d’échecs. Après avoir confié le mouvement de leur adversaire à l’algorithme dans leur oreille, le joueur humain pourrait demander des conseils sur ce qu’il faut faire ensuite, ou en bougeant de son propre chef – s’ils étaient en train de faire un mouvement stupide, AlterEgo pourrait leur faire savoir. « C’était une métaphore pour montrer qu’à l’avenir, grâce à AlterEgo, vous pourriez avoir un système d’IA sur vous en tant que second soi et augmenter la prise de décision humaine « , dit Kapur.

Jusqu’à présent, AlterEgo a une précision de 92 % dans la détection des mots que quelqu’un se dit à lui-même, dans le cadre du vocabulaire limité sur lequel Kapur a formé le système. Et cela ne fonctionne que pour une seule personne à la fois – le système doit être formé sur la façon dont chaque nouvel utilisateur se sous-vocalise pendant environ 10 ou 15 minutes avant qu’il ne fonctionne.

Malgré ces limites, il existe une multitude de possibilités de recherche pour AlterEgo. Maes dit que l’équipe a reçu de nombreuses demandes depuis que le projet a été publié en mars pour savoir comment AlterEgo pourrait aider les personnes ayant des troubles de la parole, des maladies comme la SLA qui rendent la parole difficile et celles qui ont perdu leur voix. Kapur est également intéressé à explorer si la plate-forme pourrait être utilisée pour augmenter la mémoire. Par exemple, il envisage de sous-vocation d’une liste vers AlterEgo, ou le nom d’une personne, et de pouvoir ensuite rappeler cette information à une date ultérieure. Cela pourrait être utile pour ceux d’entre nous qui ont tendance à oublier des noms, ainsi que pour les personnes qui perdent la mémoire à cause de maladies comme la démence et la maladie d’Alzheimer.

Il s’agit d’objectifs de recherche à long terme. Dans l’immédiat, Kapur espère élargir le vocabulaire d’AlterEgo afin qu’il puisse comprendre davantage de mots sous-vocalisés. Avec une plus grande liste de vocabulaire, la plate-forme pourrait être testée en situation réelle et peut-être ouverte à d’autres développeurs. Un autre domaine clé à améliorer est l’apparence de l’appareil. À l’heure actuelle, il ressemble à une version minimaliste d’un harnais, le genre que vous avez eu en primaire pour redresser vos dents – ce qui n’est pas idéal pour un usage quotidien. L’équipe cherche donc à tester de nouveaux types de matériaux qui pourraient détecter les signaux électro-neuromusculaires mais qui sont suffisamment invisibles pour rendre le port d’AlterEgo socialement acceptable.
Mais il y a des défis à relever – principalement un manque de données. Comparé à la quantité de données qui pourraient être utilisées pour former des algorithmes de reconnaissance vocale qui sont tout simplement disponibles en ligne, il n’y a rien sur la sous-vocalisation. Cela signifie que l’équipe doit tout rassembler elle-même, du moins pour le moment.

Malgré tout, les implications d’AlterEgo sont passionnantes. La technologie permettrait une nouvelle façon de penser la façon dont nous interagissons avec les ordinateurs, une façon de penser qui ne nécessite pas d’écran mais qui préserve la confidentialité de nos pensées.

« Traditionnellement, je pense que les ordinateurs sont généralement considérés comme des outils externes », explique M. Kapur. « Pourrions-nous avoir un pont complémentaire entre les humains et les ordinateurs, et construire un système qui nous permettrait de profiter des avantages des ordinateurs ?

Laisser un commentaire