Baidu a développé une nouvelle technique pour une traduction automatique en temps réel plus fluide.

Le défi : Le développement d’un système de traduction simultanée a été difficile à mettre en place parce que l’ordre des mots diffère d’une langue à l’autre. Considérez cette phrase en français, puis en chinois : « Le président américain rencontre le premier ministre anglais. » « 美国总统与英国首相会晤. » En anglais, le mot « rencontre » apparaît près du début ; son homologue chinois, « 会晤« . (huiwu), apparaît à la fin. Pour cette raison, les systèmes de traduction commerciaux « en temps réel » attendent que la personne complète une phrase avant de la traduire dans la langue cible. Le résultat est une expérience utilisateur maladroite avec des décalages gênants.

Comment ça marche : La nouvelle approche de Baidu raccourcit le délai en commençant avant la fin d’une phrase. Si le système traduisait la phrase ci-dessus du chinois vers l’anglais, par exemple, il anticiperait le mot anglais « meets » après avoir entendu la première partie de la phrase chinoise, en fonction de la probabilité que le président américain rencontre quelqu’un. L’idée a été inspirée par une technique d’anticipation couramment utilisée par les traducteurs humains pour suivre le rythme de l’orateur.

« La traduction simultanée, qui traduit des phrases avant qu’elles ne soient terminées, est utile dans de nombreux scénarios, mais elle est notoirement difficile en raison des différences dans l’ordre des mots et des exigences de simultanéité. Nous introduisons un modèle très simple mais étonnamment efficace, le modèle `wait-k’, qui permet de générer la phrase cible en même temps que la phrase source, mais toujours k mots derrière, pour n’importe quel k. Ce cadre intègre de façon transparente l’anticipation et la traduction dans un modèle unique qui implique seulement des changements mineurs au cadre de traduction neuronale existant. Les expériences de traduction simultanée du chinois vers l’anglais permettent d’obtenir une latence de 5 mots avec une dégradation de la qualité de 3,4 points BLEU (simple référence) par rapport à une traduction non simultanée de phrases complètes. Nous formulons également une nouvelle mesure du temps de latence qui comble les lacunes des mesures précédentes. »

Travaux en cours : Comme tout modèle d’apprentissage prédictif par machine, le système ne fonctionne avec une précision raisonnable que s’il est formé sur un grand nombre de données linguistiques avec des structures de phrases similaires. Par conséquent, le déploiement à grande échelle de ce système comporte encore d’importantes limites. Les chercheurs de Baidu ont découvert que le système ne fonctionne pas aussi bien que les traducteurs de phrases complètes dans des expériences de traduction du chinois vers l’anglais avec un retard de cinq mots. Mais les chercheurs sont enthousiasmés par la nouvelle voie à suivre. « La traduction simultanée pour les interprètes humains est extrêmement difficile et fastidieuse « , explique Liang Huang, le scientifique principal de Baidu Research,  » c’est pourquoi nous espérons que les machines peuvent intervenir et rendre ce service plus accessible aux professionnels et aux consommateurs « .

Nous avons vu que Google proposait déjà la traduction en live ici.

Publicités

1 commentaire »

Laisser un commentaire

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.