Un algorithme formé sur les emojis, DeepMoji, sait quand on est sarcastique sur Twitter

La compréhension du sarcasme pourrait aider l’IA à lutter contre le racisme, les abus et le harcèlement.

Scrollez à travers Twitter et vous trouverez beaucoup de commentaires sarcastiques – sans parler de nombreux cas où le sarcasme apparemment allait directement pour la tête de quelqu’un.

Heureusement, un algorithme que les chercheurs du MIT ont développé pour analyser les tweets peuvent maintenant détecter le sarcasme et le sous-texte émotionnel en général, mieux que la plupart des gens.

Détecter le sentiment des messages sur les réseaux sociaux est déjà utile pour suivre les attitudes à l’égard des marques et des produits et pour identifier les signaux susceptibles d’indiquer les tendances sur les marchés financiers. Mais plus précisément, la signification des tweets et des commentaires pourrait aider les ordinateurs à localiser automatiquement et à annuler les abus et les discours haineux en ligne. Une compréhension plus approfondie de Twitter devrait également aider les universitaires à comprendre comment l’information et l’influence traversent le réseau. De plus, au fur et à mesure que les machines deviennent plus intelligentes, la capacité à sentir l’émotion pourrait devenir une caractéristique importante de la communication homme-machine.

Les chercheurs visaient initialement à développer un système capable de détecter des messages racistes sur Twitter. Mais ils se sont vite rendu compte que le sens de nombreux messages ne pouvait pas être bien compris sans une certaine compréhension du sarcasme.

L’algorithme utilise l’apprentissage en profondeur, une technique d’apprentissage mécanique populaire qui s’appuie sur la formation d’un très grand réseau de neurones simulés pour reconnaître des modèles subtils en utilisant une grande quantité de données. Le secret de la formation de cet algorithme était que de nombreux tweets utilisaient déjà quelque chose comme un système d’étiquetage pour le contenu émotionnel: l’emoji. Une fois qu’ils ont profité de cela pour aider le système à lire les tweets pour l’émotion en général, les chercheurs ont commencé à apprendre à reconnaître le sarcasme.

« Parce que nous ne pouvons pas utiliser l’intonation de notre langage vocal ou corporel pour contextualiser ce que nous disons, les émules sont la façon dont nous le faisons en ligne », explique Iyad Rahwan, professeur agrégé, au laboratoire MIT Media qui a développé l’algorithme avec l’un de ses Étudiants, Bjarke Felbo. « Le réseau neuronal a appris la connexion entre un certain type de langue et un emoji« .

Pour former l’algorithme, baptisé DeepMoji, les chercheurs ont recueilli 55 milliards de tweets, puis ont sélectionné 1,2 milliard avec une combinaison de 64 emoji populaires. D’abord, ils ont formé le système pour prédire quel émoji serait utilisé avec un message particulier, selon qu’il s’agissait heureux, triste, humoristique, etc. Après cela, le système a été enseigné à identifier le sarcasme en utilisant un ensemble de données existantes d’exemples étiquetés. L’algorithme qui avait été pré-formé à l’aide d’emoji était beaucoup mieux pour détecter le sarcasme que celui qui n’avait pas. Ils vont publier l’algorithme pour quiconque souhaite l’utiliser.

Pour voir comment DeepMoji est bon, les chercheurs l’ont testé sur plusieurs repères pour détecter le sentiment et l’émotion dans le texte. Ils ont constaté qu’il était beaucoup mieux que les meilleurs algorithmes existants dans chaque cas.

Ils l’ont également testé les humains, en utilisant des volontaires recrutés sur le site de crowdsourcing Mechanical Turk. Ils ont trouvé que c’était plus évident de repérer le sarcasme et d’autres émotions sur Twitter qu’en vrai. Il était juste à 82% d’identifier le sarcasme correctement, comparativement à un score moyen de 76 pour cent pour les volontaires humains.

 Le site DeepMoji peut générer automatiquement des emoji pour un tweet.

« Il se peut que ce soit l’apprentissage de toutes les différentes argot », dit Felbo. « Les gens ont des utilisations très intéressantes de la langue [sur Twitter] -let’s put it way ».

Les chercheurs ont construit un site DeepMoji pour démontrer la partie emoji du système. Il apportera automatiquement des emoji appropriés à un texte. Cela semble fonctionner très bien, bien que lorsque j’ai essayé de saisir le tweet « covfefe » , maintenant infâme de Donald Trump, il était aussi confus que tous les autres.

Le site permet également aux utilisateurs de contribuer à la recherche en annotant leurs propres tweets avec des émotions. C’est un élément important du travail, dit Rahwan. Habituellement, les chercheurs ont des bénévoles sur les tweets ou les messages d’autres personnes avec une émotion perçue, ce qui fournit une mesure moins directe. « Ces repères ne permettent pas de saisir ce que les psychologues considèrent comme un véritable sentiment », dit-il.

Gary King, directeur de l’Institut des sciences sociales quantitatives de l’Université de Harvard et un expert sur les réseaux sociaux miniers pour le sens, dit utiliser l’emoji comme moyen de formation est une idée intelligente. Mais il se demande combien il est important d’identifier le sarcasme s’il est flou pour la plupart des gens. « Si le sarcasme est tellement nuancé qu’un lecteur humain le manquerait probablement, alors ça n’a pas d’importance », dit-il.

Néanmoins, le travail reflète le fait que les ordinateurs s’améliorent progressivement pour détecter les émotions humaines. L’analyse du sens du texte est déjà une technique largement utilisée. Par exemple, il peut aider les entreprises à déterminer à partir du contenu d’un courrier électronique ou d’un message de chat si un client est particulièrement en colère.

Il peut devenir de plus en plus courant pour les ordinateurs d’essayer de déchiffrer nos émotions. Imaginez, peut-être, un travailleur de robot qui comprend quand ses collègues humains se frustent ou lorsqu’ils fournissent un compliment sarcastique.

« Si les machines vont coopérer avec nous, elles devront nous comprendre, et l’émotion est vraiment difficile », dit Rahwan.

Publicités

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s