Publicités

Un modèle universel rare dans les langues humaines

Un modèle universel rare dans les langues humaines

Certaines langues sont parlées plus rapidement que d’autres, mais le taux d’information qu’elles transmettent est le même.

Je me suis posé des questions de la complexité des langues parce que je regarde toutes sortes de séries étrangères sur Netflix : les dernières en date sont Occupied (en norvégien et russe), Better than Us (russe) et quelques autres en suédois, coréen et espagnol.

Au début des années 1960, un doctorant de l’Université Cornell voulait savoir s’il y avait quelque chose de vrai derrière le « stéréotype culturel » selon lequel certains étrangers parlent plus vite que les Américains. Il a enregistré 12 de ses camarades de classe – six japonophone et six anglophones américains – monologues sur la vie sur le campus, analysé une minute du discours de chaque homme et constaté que les deux groupes produisaient des sons à peu près à la même vitesse. Lui et un de ses coauteurs ont conclu que  » l’auditeur juge le débit d’élocution d’une langue étrangère en fonction de ses antécédents linguistiques  » et que les humains du monde entier étaient tous susceptibles de parler plus ou moins aussi vite.

Depuis un demi-siècle, des études plus rigoureuses ont montré que, au-delà des préjugés, certaines langues – comme le japonais, le basque et l’italien – sont parlées plus rapidement que d’autres. Mais à mesure que les méthodes mathématiques et la puissance de calcul se sont améliorées, les linguistes ont passé plus de temps à étudier non seulement le débit de la parole, mais aussi les efforts qu’un orateur doit déployer pour faire passer un message à un auditeur. En calculant la quantité d’informations que chaque syllabe d’une langue véhicule, il est possible de comparer l' »efficacité » des différentes langues. Et une étude publiée ce mois-ci dans Science Advances a révélé que les langues plus efficaces ont tendance à être parlées plus lentement. En d’autres termes, quelle que soit la rapidité avec laquelle les locuteurs bavardent, le taux d’information qu’ils transmettent est à peu près le même entre les langues.

Le problème fondamental de « l’efficacité », en linguistique, commence par le compromis entre l’effort et la communication. Il faut une certaine coordination, et brûler un certain nombre de calories, pour que les bruits sortent de votre bouche de façon intelligible. Et ces bruits peuvent être plus ou moins informatifs pour l’auditeur, selon qu’ils sont prévisibles ou non. Si vous et moi parlons des dinosaures, vous ne seriez pas surpris de m’entendre parler de mes espèces préférées. Mais si un étranger s’approche de vous dans la rue et vous annonce « Diplodocus », c’est inattendu. Il réduit considérablement la portée des sujets de conversation possibles et est donc très instructif.

L’informativité en linguistique est généralement calculée par syllabe, et elle est mesurée en bits, tout comme les fichiers informatiques. Le concept peut être assez glissant lorsqu’il s’agit de parler, mais essentiellement, un peu d’information linguistique est la quantité d’information qui réduit de moitié l’incertitude. En d’autres termes, si je prononce une syllabe, et que cette énonciation rétrécit l’ensemble des choses dont je pourrais parler de tout dans le monde à seulement la moitié des choses dans le monde, cette syllabe porte un peu d’information.

Dans la nouvelle étude, les auteurs ont calculé la densité moyenne d’information, c’est-à-dire le nombre de bits par syllabe, d’un ensemble de 17 langues eurasiennes et l’ont comparée au débit moyen de parole, en syllabes par seconde, de 10 locuteurs pour chaque langue. Ils ont constaté que le taux de transfert de l’information est demeuré constant, soit environ 39,15 bits par seconde, pour être exact.

François Pellegrino, l’auteur principal de la nouvelle étude, affirme que les linguistes ne seront probablement pas surpris d’apprendre qu’il y a un compromis à faire entre le débit de parole et la densité d’information : « Ça confirme juste ce que serait l’intuition. » Mais la particularité de son travail et de celui de son équipe est que, pour la première fois, ils ont pu « prouver qu’il tient la route » pour cet ensemble de langues.

Le compromis entre rapidité et efficacité risque d’alimenter un débat de longue date entre linguistes sur ce qu’est une langue et à quoi elle sert. « L’une des grandes divisions dans le domaine de la linguistique à l’heure actuelle est de savoir s’il est utile de considérer la langue comme un code de communication ou s’il est plus utile de considérer la langue comme un langage mathématique « , dit Richard Futrell, professeur adjoint en sciences du langage à l’UC Irvine. Cette controverse est souvent décrite comme une lutte pour savoir si des universels linguistiques existent : Le camp de langue-math, alias les génerativistes, suivent les traces de Noam Chomsky et pensent que certaines règles grammaticales s’appliquent à toutes les langues, alors que le camp de langue-math, alias les fonctionnalistes, pense que c’est de la foutaise.

Mais le désaccord est plus nuancé que cela. Selon Futrell, les fonctionnalistes sont plus susceptibles d’appuyer les recherches qui trouvent des vérités universelles sur la façon dont le langage est utilisé, tandis que les Chomskyens s’intéressent davantage aux universels de ce qui consiste le langage. La relation entre le débit de parole et la densité de l’information mise au jour dans la nouvelle étude est susceptible d’intéresser les fonctionnalistes, car elle donne à penser que quelque chose au sujet du langage est fondamentalement orienté vers le transfert d’information entre locuteurs. Mais, dit Futrell, « Je pense que les Chomskyens diraient que ce n’est pas du tout pertinent. »

Le truc avec les universaux, c’est qu’ils doivent être vrais… universellement. Les 17 langues que Pellegrino et ses collègues ont analysées dans cet article sont impressionnantes, mais elles ne représentent certainement pas l’éventail complet de la diversité linguistique sur Terre, et elles omettent complètement les langues d’Afrique, d’Amérique, d’Australie et des îles du Pacifique. « Il y a 6 000 langues dans le monde, dit Futrell. « Il y a donc beaucoup plus de travail à faire dans la comparaison inter-linguistique. »

La nouvelle étude s’appuie également sur des données de débit de parole provenant de seulement 10 locuteurs par langue, tous jeunes et instruits. M. Pellegrino n’est pas trop préoccupé par la taille de son échantillon, dit-il, parce que l’analyse statistique de l’équipe a révélé que les personnes parlant une langue avaient un impact beaucoup plus important sur leur vitesse que leur identité individuelle. En outre, dit-il, « les études interlinguistiques utilisant plus d’une douzaine de langues ne sont pas très courantes », et celles qui couvrent un terrain aussi vaste ont tendance à n’utiliser qu’une poignée de locuteurs. « C’est aussi un compromis d’une certaine façon, dit-il.

Il y a aussi la question de savoir si le compromis entre la vitesse et l’efficacité se maintiendrait dans les conversations spontanées, et pas seulement pour les textes lus à haute voix. Pellegrino et Futrell prédisent que le taux d’information moyen pour la parole occasionnelle serait inférieur à 39 bits par seconde, mais qu’il serait toujours à peu près le même entre les langues. Au moins dans ce groupe restreint de 17 personnes, l’échange d’une langue contre une autre ne devrait pas changer de façon significative le temps qu’il faut pour faire passer une idée donnée. Si je vous avais parlé de cette recherche en vietnamien, par exemple, cela aurait probablement pris aussi longtemps.

Via The Atlantic

Publicités

Laisser un commentaire

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.

%d blogueurs aiment cette page :