Un portrait possible de Christopher Marlowe. (Crédit: anonyme via Wikimedia Commons)

Une nouvelle analyse statistique identifie Christopher Marlowe comme un coauteur probable de tous les trois de William Shakespeare Henri VI pièces.

La question de savoir si Shakespeare a vraiment écrit chaque mot dans chaque scène de ses pièces a circulé depuis la vie du barde. Des théories du complot plus sages prétendent que le dramaturge n'a jamais vraiment existé, ou était seulement un acteur et pas un dramaturge. Les lettrés littéraires ont débattu des pièces qui auraient pu être coécrites - et qui pourraient être ces coauteurs non accrédités.

Des chercheurs en informatique de l'École d'ingénierie et de sciences appliquées de l'Université de Pennsylvanie, travaillant avec un chercheur de Shakespeare à l'Université De Montfort, utilisent une nouvelle méthode statistique pour aller au fond de cette question.

Shakespeare avait de l'aide

Dans un prochain essai dans Shakespeare Quarterly, ils fournissent de nouvelles preuves que tous les trois Henri VI les pièces contiennent une langue écrite par un autre auteur. Leur analyse identifie Christopher Marlowe comme le candidat le plus probable, bien que d'autres auteurs aient pu être impliqués aussi bien.

"Une approche plus fiable consiste à utiliser des mots fonctionnels plutôt que significatifs:" the "," and "," to, "et ainsi de suite."


graphique d'abonnement intérieur


Une chose est sûre: Shakespeare n'a pas écrit ces pièces seul.

Même avant l'avènement des ordinateurs, les spécialistes de la littérature ont tenté de quantifier le style d'un auteur dans ses efforts pour résoudre les questions d'attribution. Cependant, la rigueur des techniques disponibles, qui impliquait souvent le comptage manuel, a provoqué des conflits. Les approches computationnelles ont redynamisé le domaine avec la promesse d'une fiabilité et d'une objectivité accrues.

"L'utilisation des sciences de l'information pour répondre à des questions sur la paternité contestée remonte à deux décennies, et elle a grandi avec la puissance de calcul. Mais notre approche ne se limite pas à compter », explique Alejandro Ribeiro, professeur agrégé au département de génie électrique et des systèmes.

Focus sur les petits mots

Les approches informatiques antérieures ont essayé de quantifier le style d'auteur à travers le vocabulaire et l'usage. Le comptage de la fréquence de certains mots et leur comparaison à travers des textes ont été utilisés pour créer des profils de vocabulaires d'auteurs. Cependant, cette approche a un défaut - la distribution des mots utilisés dans un texte pourrait être plus influencée par son sujet que par son auteur.

«Une approche plus fiable consiste à utiliser des mots fonctionnels plutôt que significatifs:« le »,« et »ou« à »,« et ainsi de suite », explique le coauteur Santiago Segarra. "Tout le monde doit utiliser ces mots, donc analyser comment ils diffèrent entre les auteurs se rapproche d'une mesure objective de« style »."

Plutôt que de simplement compter la fréquence de tels mots, l'équipe de Penn a mesuré leur proximité les uns aux autres. Après avoir construit une liste de mots fonctionnels 50-100 qui apparaissent dans les textes cibles, les chercheurs appliquent un algorithme pour en déduire des "réseaux d'adjacence de mots".

Chaque paire de mots fonctionnels reçoit un score basé sur le nombre de mots à part qu'ils apparaissent l'un à l'autre. Ensemble, ces partitions sont remarquablement cohérentes entre différents textes du même auteur, agissant comme une sorte d '«empreinte» stylistique.

"Par exemple," dit Ribeiro, "Si nous avons formé ce système sur une pièce de moi et une pièce de Santiago, et que nous lui avons ensuite donné une autre pièce écrite par l'un d'entre nous, elle pourrait dire laquelle l'a écrit 98% du temps. "

Entraînement de l'algorithme

Connaissant les débats en cours sur la paternité shakespearienne, l'équipe de Penn a collaboré avec Gabriel Egan, professeur d'études Shakespeare à De Montfort, pour s'assurer qu'ils travaillaient dans les limites d'un consensus savant. Par exemple, les érudits acceptent maintenant largement John Fletcher en tant que co-auteur d'une des dernières pièces de Shakespeare, Les deux nobles Kinsmen. Certains des premiers travaux de Shakespeare, tels que le Henri VI joue et Titus Andronicus, étaient considérés comme des collaborations, mais combien et avec qui était moins clair. Cela en a fait de bonnes cibles pour une analyse plus approfondie.

"La langue est le problème ultime du" big data "."

Les chercheurs ont formé leur algorithme sur l'intégralité du corpus de pièces de Shakespeare, en développant une empreinte stylistique pour lui. Ils ont également développé les empreintes digitales de plusieurs contemporains notables, dont Fletcher, Christopher Marlowe, Thomas Middleton, Ben Jonson, George Peele et d'autres. Enfin, ils ont combiné tous les textes de tous les candidats dans un même profil, essentiellement une empreinte digitale «moyenne» pour les auteurs de langue anglaise de cette époque.

L'analyse des empreintes digitales du réseau de proximité du corpus shakespearien suggère que les trois Henri VI les pièces étaient des valeurs aberrantes stylistiques parmi les pièces de Shakespeare. Cette anomalie rendait très improbable que Shakespare ait entièrement écrit ces pièces, confirmant les résultats générés par les approches computationnelles des autres groupes.

"Nous voyons des études indépendantes avec différentes méthodologies convergeant vers la même conclusion", explique Egan. "" Plus ces approches indépendantes convergent, plus nous pouvons être confiants. "

Confiant que le Henri VI les pièces étaient aberrantes, la tâche suivante consistait à voir les empreintes stylistiques des autres. Christopher Marlowe et George Peele, longtemps pensé pour avoir été les collaborateurs anonymes sur Titus Andronicus, étaient les deux principaux candidats.

"Si vous deviez choisir un candidat, ce serait Marlowe", dit Segarra. "Si vous deviez choisir deux, alors vous iriez pour Marlowe et Peele, mais dans le cas de ce dernier, nous n'avons pas un échantillon assez grand pour entraîner complètement le classificateur. Une fois que vous combinez cela avec les preuves historiques, Marlowe devient clairement le coauteur préféré. "

Egan est confiant que les preuves historiques font pencher la balance vers Marlowe. "D'autres chercheurs utilisant des approches totalement différentes ont récemment découvert des preuves qui font de Marlowe le candidat idéal."

"Il y a une scène d'émeute très célèbre dans Henri VI», Raconte Egan,« où l'un des partisans de Jack Cade, un révolutionnaire, dit: «Tout d'abord, nous allons tuer tous les avocats. Je pense que Marlowe était responsable des scènes de Jack Cade. Bien sûr, nous ne savons pas s'ils se sont assis ensemble et ont travaillé comme coauteurs. Shakespeare peut avoir adapté ces passages par la suite, par exemple. "

Par Shakespeare et Marlowe

Egan et ses co-éditeurs du New Oxford Shakespeare Œuvres complètes identifiera Marlowe comme coauteur de Shakespeare pour les trois Henri VI pièces. Le nouveau Oxford Shakespeare, qui contient des versions de tous les écrits de Shakespeare dans les deux orthographes modernes et originales, ainsi que l'analyse et le commentaire, est considéré comme l'une des ressources érudites les plus autorisées sur le dramaturge.

«Il est approprié que ces questions sur la langue soient abordées au lieu de naissance des ordinateurs, avec ENIAC», explique Egan.

«La langue est le problème ultime des« big data »et l'attribution de la paternité à ses propriétaires légitimes est à la fois un défi technique et, pour les éditeurs, une obligation morale. Il est approprié qu'une collaboration d'écrivains du XXIe siècle issus d'horizons différents et possédant des compétences différentes mais complémentaires permette de découvrir une collaboration du XVIe siècle dont l'origine est également diversifiée.

La source: Université de Pennsylvanie

Livres connexes:

at Marché InnerSelf et Amazon