Want to create interactive content? It’s easy in Genially!

Get started free

L'origine de la stylométrie et son évolution

gmonayron

Created on August 22, 2024

Cette frise chronologique résume les étapes clés de l'évolution de la stylométrie. Elle se base sur la revue de littérature publiée dans Forensic Science International: Synergy en juin 2024, par Valentina Cammarota, Silvia Bozza, Claude-Alain Roten et Franco Taroni.

Start designing with a free template

Discover more than 1500 professional designs like these:

Practical Timeline

Timeline video mobile

Timeline Lines Mobile

Major Religions Timeline

Timeline Flipcard

Timeline video

History Timeline

Transcript

L'origine de la stylométrie et son évolution

Premières descriptions quantitatives de textes :

Avant J.-C.

Après J.-C.

Avant J.-C.

180

300

950

J.-C.

Dans ces premiers exemples, on ne parle pas encore d'identifier l'auteur d'un texte. Mais selon le scientifique Joseph Rudman, il s'agit des premières tentatives de décrire quantitativement des textes, c’est-à-dire de les analyser en utilisant des chiffres ou des statistiques.

Ces trois figures ont joué un rôle crucial dans la préservation et l’analyse de textes religieux et littéraires phares de leur culture respective.

1/4
L'origine de la stylométrie et son évolution

XIXème siècle

1851

1890

Date clé

2/4
L'origine de la stylométrie et son évolution

XXème siècle

1938

1944

1901

1932

1963

1970

1990

De nombreux chercheurs se sont attachés à développer les connaissances en stylométrie au cours du 20ème siècle. Cependant, les études les plus connues sont celles de George K. Zipf (1932) et de George Yule (1938 & 1944).

3/4
L'origine de la stylométrie et son évolution

lectures pour aller plus loin:

  • Authorship Attribution: Statistical and Computational Methods
  • Who Was the Author? An Introduction to Stylometry
  • Quantitative Authorship Attribution: An Evaluation of Techniques
  • Who Wrote the 15th Book of Oz? An Application of Multivariate Analysis to Authorship Attribution
  • A survey of modern authorship attribution methods
  • Extension of Zipf's law to words and phrases
  • Analysis of Stylometric Variables in Long and Short Texts
  • The Evolution of Stylometry in Humanities Scholarship
  • Blended Authorship Attribution: Unmasking Elena Ferrante Combining Different Author Profiling Methods

Search

Search

Search

Search

Search

Search

Search

Search

Search

4/4

1970

Le démarrage du développement technologique permet le lancement de nombreuses études pour identifier de nouveaux marqueurs de style et élaborer de nouvelles méthodes d'analyse, plus rapides et poussées puisque assistées par ordinateur.

1944

George Yule développe la "caractéristique K", une métrique associée à la distribution des occurrences des mots. Elle évalue le degré de concentration des mots les plus fréquents dans un texte. Si K est élevé, alors certains mots apparaissent très souvent, et les autres se font plus rares. C'est une façon de quantifier l'inégalité de distribution des mots dans un texte, similaire à l'idée derrière la loi de Zipf.

+info

1932

George K. Zipf, linguiste et philologue américain, démontre une relation entre le nombre d'occurrences de types de mots et leur fréquence. Soit la fréquence à laquelle certains types de mots (noms, verbes, adjectifs, adverbes, etc.) apparaissent dans un texte donné. Cette découverte conduira à la création de la première loi de Zipf.

La première loi de Zipf affirme que la fréquence d'un mot est inversement proportionnelle à son rang de fréquence. Par exemple, le mot le plus courant sera utilisé deux fois plus souvent que le deuxième mot le plus courant, trois fois plus souvent que le troisième, etc. Formant ainsi une hiérarchie entre les mots.

1990

L’analyse stylométrique fait un grand bond en avant, grâce à la diffusion des techniques de machine learning. Celles-ci permettent de mieux décrire et classer les textes en fonction de leur style. En parallèle, le développement de la communication virtuelle ouvre de nouvelles possibilités pour l'étude des textes.

1851

Date clé à partir de laquelle la stylométrie devient un outil, utilisé pour tenter d'identifier l'auteur d'un texte. Le basculement se fait grâce à l'étude d’Augustus de Morgan, mathématicien britannique, qui découvre que la longueur des mots est en réalité un véritable marqueur de style. Les origines de la stylométrie, comme outil permettant d’attribuer la paternité d’un texte, sont donc généralement associées à cette date-là.

1938

George Yule, statisticien écossais, identifie l'instabilité de la longueur des phrases comme un marqueur de style.

1963

Introduction d’une approche multivariée au niveau lexical. Ce qui signifie que désormais, les analyses en stylométrie ne se penchent plus uniquement sur une caractéristique. Frederick Mosteller et David L. Wallace, deux statisticiens américains, publient une méthode d'inférence basée sur une approche statistique bayésienne pour l'attribution d'auteurs, en se basant sur le travail du physicien américain Thomas Mendenhall (1901). Méthode qui a permis de mettre en évidence le potentiel de la stylométrie dans la pratique, mais qui sera cependant remise en question trente ans plus tard.

Cette méthodologie a notamment été utilisée pour attribuer de manière probabiliste les auteurs des Federalist Papers, une série d'articles politiques américains publiés entre 1787 et 1788 pour soutenir l'adoption de la Constitution des États-Unis. Ils ont été écrits par Alexander Hamilton, James Madison et John Jay sous le pseudonyme "Publius".

1890

Wincenty Lutosławski, philosophe polonais, utilise pour la première fois le mot stylométrie dans son travail sur la datation chronologique des dialogues de Platon.

© Crédits photos

Toutes les images sont libres de droits ou appartiennent au domaine public.

Attribution requise:

  • Fond: Image by Nile from Pixabay
  • Hindouisme: Image by Rhiannon from Pixabay
  • Grèce: Image by Dimitris Vetsikas from Pixabay
  • Bible: Image by AgnieszkaMonk from Pixabay
  • Phrase: Image by PDPics from Pixabay
  • Ordinateur: Image by SSidde from Pixabay
  • Code: Image by Pexels from Pixabay
  • Bible ancienne: Image by cgrape from Pixabay

300 av. J.-C.

Saunaka, grammairien sanskrit, réalise la première description quantitative de textes, à partir du Rig-Veda, un ancien texte religieux indien, afin d’en assurer la préservation.

180 av. J.-C.

Aristarque de Samothrace, érudit grec, célèbre pour son travail sur les textes homériques, enregistre des expressions rares ou uniques dans les textes grecs, contribuant ainsi à la philologie classique.

* auteur massorète

Un auteur massorète est un érudit juif du Moyen Âge qui contribue à la préservation et à la transmission précise du texte de la Bible hébraïque. Le travail de ces auteurs a permis une transmission fidèle des textes bibliques à travers les générations.

950 ap. J.-C.

Aaron Ben-Asher, auteur massorète*, compte différents éléments de la Bible, y compris le nombre de lettres, de mots et de phrases.

1901

Thomas Mendenhall, physicien américain, étudie le style des pièces attribuées à Shakespeare en utilisant la longueur des mots comme indicateur, pour discuter de leur authenticité.