Full screen
Share
Show pages







L'origine de la stylométrie et son évolution
gmonayron
Created on August 22, 2024
Cette frise chronologique résume les étapes clés de l'évolution de la stylométrie. Elle se base sur la revue de littérature publiée dans Forensic Science International: Synergy en juin 2024, par Valentina Cammarota, Silvia Bozza, Claude-Alain Roten et Franco Taroni.
Over 30 million people create interactive content in Genially
Check out what others have designed:
BEYONCÉ
Horizontal infographics
DEMOCRATIC CANDIDATES NOV DEBATE
Horizontal infographics
ONE MINUTE ON THE INTERNET
Horizontal infographics
SITTING BULL
Horizontal infographics
RUGBY WORLD CUP 2019
Horizontal infographics
GRETA THUNBERG
Horizontal infographics
FIRE FIGHTER
Horizontal infographics
Transcript
J.-C.
1/4
Premières descriptions quantitatives de textes :
L'origine de la stylométrie et son évolution
Ces trois figures ont joué un rôle crucial dans la préservation et l’analyse de textes religieux et littéraires phares de leur culture respective.
950
Après J.-C.
300
Avant J.-C.
Dans ces premiers exemples, on ne parle pas encore d'identifier l'auteur d'un texte. Mais selon le scientifique Joseph Rudman, il s'agit des premières tentatives de décrire quantitativement des textes, c’est-à-dire de les analyser en utilisant des chiffres ou des statistiques.
180
Avant J.-C.
L'origine de la stylométrie et son évolution
XIXème siècle
2/4
1890
Date clé
1851
L'origine de la stylométrie et son évolution
De nombreux chercheurs se sont attachés à développer les connaissances en stylométrie au cours du 20ème siècle. Cependant, les études les plus connues sont celles de George K. Zipf (1932) et de George Yule (1938 & 1944).
XXème siècle
1990
1970
1963
3/4
1932
1901
1944
1938
Search
Search
Search
Search
Search
Search
Search
Search
Search
- Authorship Attribution: Statistical and Computational Methods
- Who Was the Author? An Introduction to Stylometry
- Quantitative Authorship Attribution: An Evaluation of Techniques
- Who Wrote the 15th Book of Oz? An Application of Multivariate Analysis to Authorship Attribution
- A survey of modern authorship attribution methods
- Extension of Zipf's law to words and phrases
- Analysis of Stylometric Variables in Long and Short Texts
- The Evolution of Stylometry in Humanities Scholarship
- Blended Authorship Attribution: Unmasking Elena Ferrante Combining Different Author Profiling Methods
L'origine de la stylométrie et son évolution
lectures pour aller plus loin:
4/4
1970
Le démarrage du développement technologique permet le lancement de nombreuses études pour identifier de nouveaux marqueurs de style et élaborer de nouvelles méthodes d'analyse, plus rapides et poussées puisque assistées par ordinateur.
1944
+info
George Yule développe la "caractéristique K", une métrique associée à la distribution des occurrences des mots. Elle évalue le degré de concentration des mots les plus fréquents dans un texte. Si K est élevé, alors certains mots apparaissent très souvent, et les autres se font plus rares. C'est une façon de quantifier l'inégalité de distribution des mots dans un texte, similaire à l'idée derrière la loi de Zipf.
La première loi de Zipf affirme que la fréquence d'un mot est inversement proportionnelle à son rang de fréquence. Par exemple, le mot le plus courant sera utilisé deux fois plus souvent que le deuxième mot le plus courant, trois fois plus souvent que le troisième, etc. Formant ainsi une hiérarchie entre les mots.
1932
George K. Zipf, linguiste et philologue américain, démontre une relation entre le nombre d'occurrences de types de mots et leur fréquence. Soit la fréquence à laquelle certains types de mots (noms, verbes, adjectifs, adverbes, etc.) apparaissent dans un texte donné. Cette découverte conduira à la création de la première loi de Zipf.
1990
L’analyse stylométrique fait un grand bond en avant, grâce à la diffusion des techniques de machine learning. Celles-ci permettent de mieux décrire et classer les textes en fonction de leur style. En parallèle, le développement de la communication virtuelle ouvre de nouvelles possibilités pour l'étude des textes.
Date clé à partir de laquelle la stylométrie devient un outil, utilisé pour tenter d'identifier l'auteur d'un texte. Le basculement se fait grâce à l'étude d’Augustus de Morgan, mathématicien britannique, qui découvre que la longueur des mots est en réalité un véritable marqueur de style. Les origines de la stylométrie, comme outil permettant d’attribuer la paternité d’un texte, sont donc généralement associées à cette date-là.
1851
1938
George Yule, statisticien écossais, identifie l'instabilité de la longueur des phrases comme un marqueur de style.
Cette méthodologie a notamment été utilisée pour attribuer de manière probabiliste les auteurs des Federalist Papers, une série d'articles politiques américains publiés entre 1787 et 1788 pour soutenir l'adoption de la Constitution des États-Unis. Ils ont été écrits par Alexander Hamilton, James Madison et John Jay sous le pseudonyme "Publius".
1963
Introduction d’une approche multivariée au niveau lexical. Ce qui signifie que désormais, les analyses en stylométrie ne se penchent plus uniquement sur une caractéristique. Frederick Mosteller et David L. Wallace, deux statisticiens américains, publient une méthode d'inférence basée sur une approche statistique bayésienne pour l'attribution d'auteurs, en se basant sur le travail du physicien américain Thomas Mendenhall (1901). Méthode qui a permis de mettre en évidence le potentiel de la stylométrie dans la pratique, mais qui sera cependant remise en question trente ans plus tard.
1890
Wincenty Lutosławski, philosophe polonais, utilise pour la première fois le mot stylométrie dans son travail sur la datation chronologique des dialogues de Platon.
Attribution requise:
- Fond: Image by Nile from Pixabay
- Hindouisme: Image by Rhiannon from Pixabay
- Grèce: Image by Dimitris Vetsikas from Pixabay
- Bible: Image by AgnieszkaMonk from Pixabay
- Phrase: Image by PDPics from Pixabay
- Ordinateur: Image by SSidde from Pixabay
- Code: Image by Pexels from Pixabay
- Bible ancienne: Image by cgrape from Pixabay
© Crédits photos
Toutes les images sont libres de droits ou appartiennent au domaine public.
Saunaka, grammairien sanskrit, réalise la première description quantitative de textes, à partir du Rig-Veda, un ancien texte religieux indien, afin d’en assurer la préservation.
300 av. J.-C.
180 av. J.-C.
Aristarque de Samothrace, érudit grec, célèbre pour son travail sur les textes homériques, enregistre des expressions rares ou uniques dans les textes grecs, contribuant ainsi à la philologie classique.
* auteur massorète
Un auteur massorète est un érudit juif du Moyen Âge qui contribue à la préservation et à la transmission précise du texte de la Bible hébraïque. Le travail de ces auteurs a permis une transmission fidèle des textes bibliques à travers les générations.
950 ap. J.-C.
Aaron Ben-Asher, auteur massorète*, compte différents éléments de la Bible, y compris le nombre de lettres, de mots et de phrases.
1901
Thomas Mendenhall, physicien américain, étudie le style des pièces attribuées à Shakespeare en utilisant la longueur des mots comme indicateur, pour discuter de leur authenticité.