L’apprentissage machine a révélé exactement à quel point une pièce de Shakespeare a été écrite par quelqu’un d’autre

Les analystes littéraires ont depuis longtemps remarqué la main d’un autre auteur dans Henry VIII de Shakespeare. Maintenant, un réseau neuronal a identifié les scènes spécifiques en question – et qui les a réellement écrites.

Pendant une grande partie de sa vie, William Shakespeare a été le dramaturge attitré d’une troupe de théâtre appelée King’s Men qui a joué ses pièces sur les rives de la Tamise à Londres. Lorsque Shakespeare mourut en 1616, la compagnie avait besoin d’un remplaçant et se tourna vers l’un des dramaturges les plus prolifiques et célèbres de l’époque, un homme nommé John Fletcher.

La gloire de Fletcher s’est calmée depuis. Mais en 1850, un analyste littéraire nommé James Spedding remarqua une remarquable similitude entre les pièces de Fletcher et les passages de Henry VIII de Shakespeare. Spedding a conclu que Fletcher et Shakespeare ont dû collaborer à la pièce.

Les preuves proviennent d’études sur les idiosyncrasies linguistiques de chaque auteur et sur la façon dont elles apparaissent dans Henry VIII. Par exemple, Fletcher écrit souvent  ye au lieu de you, et ’em au lieu de them. Il avait également tendance à ajouter le mot sir ou still ou next d’un pentamètre standard pour créer une sixième syllabe supplémentaire.

Ces caractéristiques ont permis à Spedding et à d’autres analystes de suggérer que Fletcher devait être impliqué. Mais la manière exacte dont la pièce a été divisée est très controversée. Et d’autres critiques ont suggéré qu’un autre dramaturge anglais, Philip Massinger, était en fait le coauteur de Shakespeare.

C’est pourquoi les analystes et les historiens aimeraient bien déterminer, une fois pour toutes, qui a écrit quelles parties d’Henry VIII.

Entre Petr Plecháč à l’Académie tchèque des sciences à Prague, qui dit qu’il a résolu le problème en utilisant l’apprentissage machine pour identifier la paternité de plus ou moins chaque ligne de la pièce. « Nos résultats soutiennent fortement la division canonique de la pièce entre William Shakespeare et John Fletcher proposée par James Spedding, » dit Plecháč

La nouvelle approche est simple en principe. Les algorithmes d’apprentissage machine sont utilisés depuis quelques années pour identifier des modèles distinctifs dans la façon dont les auteurs écrivent.

La technique utilise un corpus de travail de l’auteur pour former l’algorithme et un corpus de travail différent et plus petit pour le tester. Cependant, comme le style littéraire d’un auteur peut changer tout au long de sa vie, il est important de s’assurer que toutes les œuvres ont le même style.

Une fois que l’algorithme a appris le style en termes de mots et de rythmes les plus couramment utilisés, il est capable de le reconnaître dans des textes qu’il n’a jamais vus.

Plecháč suit exactement cette technique. Il entraîne d’abord l’algorithme à reconnaître le style de Shakespeare en utilisant d’autres pièces écrites en même temps que  Henry VIII. Ces pièces sont La Tragédie de Coriolanus, La Tragédie de Cymbeline, Le Conte d’hiver et La Tempête.

Il forme ensuite l’algorithme pour reconnaître le travail de John Fletcher à l’aide de pièces de théâtre qu’il a écrites à cette époque – Valentinian, Monsieur Thomas, The Woman’s Prize et Bonduca.

Enfin, il lâche l’algorithme sur Henry VIII. et lui demande de déterminer l’auteur du texte, en utilisant une technique de fenêtre déroulante pour faire défiler la pièce.

Les résultats sont intéressants. Ils ont tendance à être d’accord avec l’analyse de Spedding que Fletcher a écrit des scènes représentant presque la moitié de la pièce. Cependant, l’algorithme permet une approche plus fine qui révèle comment l’auteur change parfois non seulement pour de nouvelles scènes, mais aussi vers la fin des précédentes. Par exemple, dans l’acte 3, scène 2, le modèle suggère une paternité mixte après la ligne 2081 et constate que Shakespeare prend complètement le relais à la ligne 2200, avant le début de l’acte 4, scène 1.

Plecháč a également formé son modèle à reconnaître le travail de Philip Massinger mais trouve peu de preuves de son implication. « La participation de Philip Massinger est plutôt improbable, conclut-il.

C’est un travail intéressant qui montre comment les linguistes et les analystes littéraires utilisent l’apprentissage automatique pour mieux comprendre notre passé littéraire.

Cependant, il reste encore beaucoup de travail à faire. Par exemple, lorsque les algorithmes de vision machine ont été formés pour reconnaître un style artistique, les informaticiens ont rapidement compris comment extraire un style et l’appliquer à d’autres images, en utilisant une technique appelée transfert de style neuronal. Du jour au lendemain, il est devenu possible de donner à une photographie ordinaire le style d’un Van Gogh ou d’un Monet.

Cela soulève la question de savoir si une technique similaire est possible pour le texte. Serait-il possible de transformer un essai, ou même un article pour MIT Technology Review, dans le style de Shakespeare ou de John Fletcher, par exemple ?

Malheureusement, pas encore, si ce n’est par la façon triviale de remplacer les mots comme eux par  » eux et ainsi de suite « . Cela s’explique en grande partie par le fait que la structure sous-jacente de la communication n’est pas suffisamment bien comprise par les linguistes ou leurs charges algorithmiques.

Réf : arxiv.org/abs/1911.05652 : Contributions relatives de Shakespeare et Fletcher dans Henry VIII : Une analyse basée sur les mots les plus fréquents et les rythmes les plus fréquents
Via  Techreview

Laisser un commentaire

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.