Full screen

Share

Show pages

J.-C. 
1/4
Premières descriptions quantitatives de textes :
L'origine de la stylométrie et son évolution
Ces trois figures ont joué un rôle crucial dans la préservation et l’analyse de textes religieux et littéraires phares de leur culture respective.


950
Après J.-C.
300
Avant J.-C.
Dans ces premiers exemples, on ne parle pas encore d'identifier l'auteur d'un texte. Mais selon le scientifique Joseph Rudman, il s'agit des premières tentatives de décrire quantitativement des textes, c’est-à-dire de les analyser en utilisant des chiffres ou des statistiques.
180
Avant J.-C. 
Want to create interactive content? It’s easy in Genially!

Cette frise chronologique résume les étapes clés de l'évolution de la stylométrie. Elle se base sur la revue de littérature publiée dans Forensic Science International: Synergy en juin 2024, par Valentina Cammarota, Silvia Bozza, Claude-Alain Roten et Franco Taroni.

Over 30 million people create interactive content in Genially

Check out what others have designed:

BEYONCÉ

Horizontal infographics

ONE MINUTE ON THE INTERNET

Horizontal infographics

SITTING BULL

Horizontal infographics

RUGBY WORLD CUP 2019

Horizontal infographics

GRETA THUNBERG

Horizontal infographics

FIRE FIGHTER

Horizontal infographics

Transcript

J.-C.

1/4

Premières descriptions quantitatives de textes :

L'origine de la stylométrie et son évolution

Ces trois figures ont joué un rôle crucial dans la préservation et l’analyse de textes religieux et littéraires phares de leur culture respective.

950

Après J.-C.

300

Avant J.-C.

Dans ces premiers exemples, on ne parle pas encore d'identifier l'auteur d'un texte. Mais selon le scientifique Joseph Rudman, il s'agit des premières tentatives de décrire quantitativement des textes, c’est-à-dire de les analyser en utilisant des chiffres ou des statistiques.

180

Avant J.-C.

L'origine de la stylométrie et son évolution

XIXème siècle

2/4

1890

Date clé

1851

L'origine de la stylométrie et son évolution

De nombreux chercheurs se sont attachés à développer les connaissances en stylométrie au cours du 20ème siècle. Cependant, les études les plus connues sont celles de George K. Zipf (1932) et de George Yule (1938 & 1944).

XXème siècle

1990

1970

1963

3/4

1932

1901

1944

1938

Search

Search

Search

Search

Search

Search

Search

Search

Search

  • Authorship Attribution: Statistical and Computational Methods
  • Who Was the Author? An Introduction to Stylometry
  • Quantitative Authorship Attribution: An Evaluation of Techniques
  • Who Wrote the 15th Book of Oz? An Application of Multivariate Analysis to Authorship Attribution
  • A survey of modern authorship attribution methods
  • Extension of Zipf's law to words and phrases
  • Analysis of Stylometric Variables in Long and Short Texts
  • The Evolution of Stylometry in Humanities Scholarship
  • Blended Authorship Attribution: Unmasking Elena Ferrante Combining Different Author Profiling Methods
L'origine de la stylométrie et son évolution

lectures pour aller plus loin:

4/4

1970

Le démarrage du développement technologique permet le lancement de nombreuses études pour identifier de nouveaux marqueurs de style et élaborer de nouvelles méthodes d'analyse, plus rapides et poussées puisque assistées par ordinateur.

1944

+info

George Yule développe la "caractéristique K", une métrique associée à la distribution des occurrences des mots. Elle évalue le degré de concentration des mots les plus fréquents dans un texte. Si K est élevé, alors certains mots apparaissent très souvent, et les autres se font plus rares. C'est une façon de quantifier l'inégalité de distribution des mots dans un texte, similaire à l'idée derrière la loi de Zipf.

La première loi de Zipf affirme que la fréquence d'un mot est inversement proportionnelle à son rang de fréquence. Par exemple, le mot le plus courant sera utilisé deux fois plus souvent que le deuxième mot le plus courant, trois fois plus souvent que le troisième, etc. Formant ainsi une hiérarchie entre les mots.

1932

George K. Zipf, linguiste et philologue américain, démontre une relation entre le nombre d'occurrences de types de mots et leur fréquence. Soit la fréquence à laquelle certains types de mots (noms, verbes, adjectifs, adverbes, etc.) apparaissent dans un texte donné. Cette découverte conduira à la création de la première loi de Zipf.

1990

L’analyse stylométrique fait un grand bond en avant, grâce à la diffusion des techniques de machine learning. Celles-ci permettent de mieux décrire et classer les textes en fonction de leur style. En parallèle, le développement de la communication virtuelle ouvre de nouvelles possibilités pour l'étude des textes.

Date clé à partir de laquelle la stylométrie devient un outil, utilisé pour tenter d'identifier l'auteur d'un texte. Le basculement se fait grâce à l'étude d’Augustus de Morgan, mathématicien britannique, qui découvre que la longueur des mots est en réalité un véritable marqueur de style. Les origines de la stylométrie, comme outil permettant d’attribuer la paternité d’un texte, sont donc généralement associées à cette date-là.

1851

1938

George Yule, statisticien écossais, identifie l'instabilité de la longueur des phrases comme un marqueur de style.

Cette méthodologie a notamment été utilisée pour attribuer de manière probabiliste les auteurs des Federalist Papers, une série d'articles politiques américains publiés entre 1787 et 1788 pour soutenir l'adoption de la Constitution des États-Unis. Ils ont été écrits par Alexander Hamilton, James Madison et John Jay sous le pseudonyme "Publius".

1963

Introduction d’une approche multivariée au niveau lexical. Ce qui signifie que désormais, les analyses en stylométrie ne se penchent plus uniquement sur une caractéristique. Frederick Mosteller et David L. Wallace, deux statisticiens américains, publient une méthode d'inférence basée sur une approche statistique bayésienne pour l'attribution d'auteurs, en se basant sur le travail du physicien américain Thomas Mendenhall (1901). Méthode qui a permis de mettre en évidence le potentiel de la stylométrie dans la pratique, mais qui sera cependant remise en question trente ans plus tard.

1890

Wincenty Lutosławski, philosophe polonais, utilise pour la première fois le mot stylométrie dans son travail sur la datation chronologique des dialogues de Platon.

Attribution requise:

  • Fond: Image by Nile from Pixabay
  • Hindouisme: Image by Rhiannon from Pixabay
  • Grèce: Image by Dimitris Vetsikas from Pixabay
  • Bible: Image by AgnieszkaMonk from Pixabay
  • Phrase: Image by PDPics from Pixabay
  • Ordinateur: Image by SSidde from Pixabay
  • Code: Image by Pexels from Pixabay
  • Bible ancienne: Image by cgrape from Pixabay

© Crédits photos

Toutes les images sont libres de droits ou appartiennent au domaine public.

Saunaka, grammairien sanskrit, réalise la première description quantitative de textes, à partir du Rig-Veda, un ancien texte religieux indien, afin d’en assurer la préservation.

300 av. J.-C.

180 av. J.-C.

Aristarque de Samothrace, érudit grec, célèbre pour son travail sur les textes homériques, enregistre des expressions rares ou uniques dans les textes grecs, contribuant ainsi à la philologie classique.

* auteur massorète

Un auteur massorète est un érudit juif du Moyen Âge qui contribue à la préservation et à la transmission précise du texte de la Bible hébraïque. Le travail de ces auteurs a permis une transmission fidèle des textes bibliques à travers les générations.

950 ap. J.-C.

Aaron Ben-Asher, auteur massorète*, compte différents éléments de la Bible, y compris le nombre de lettres, de mots et de phrases.

1901

Thomas Mendenhall, physicien américain, étudie le style des pièces attribuées à Shakespeare en utilisant la longueur des mots comme indicateur, pour discuter de leur authenticité.

Next page

genially options

Show interactive elements