L'origine de la stylométrie et son évolution
Premières descriptions quantitatives de textes :
Avant J.-C.
Après J.-C.
Avant J.-C.
180
300
950
J.-C.
Dans ces premiers exemples, on ne parle pas encore d'identifier l'auteur d'un texte. Mais selon le scientifique Joseph Rudman, il s'agit des premières tentatives de décrire quantitativement des textes, c’est-à-dire de les analyser en utilisant des chiffres ou des statistiques.
Ces trois figures ont joué un rôle crucial dans la préservation et l’analyse de textes religieux et littéraires phares de leur culture respective.
1/4
L'origine de la stylométrie et son évolution
XIXème siècle
1851
1890
Date clé
2/4
L'origine de la stylométrie et son évolution
XXème siècle
1938
1944
1901
1932
1963
1970
1990
De nombreux chercheurs se sont attachés à développer les connaissances en stylométrie au cours du 20ème siècle. Cependant, les études les plus connues sont celles de George K. Zipf (1932) et de George Yule (1938 & 1944).
3/4
L'origine de la stylométrie et son évolution
lectures pour aller plus loin:
- Authorship Attribution: Statistical and Computational Methods
- Who Was the Author? An Introduction to Stylometry
- Quantitative Authorship Attribution: An Evaluation of Techniques
- Who Wrote the 15th Book of Oz? An Application of Multivariate Analysis to Authorship Attribution
- A survey of modern authorship attribution methods
- Extension of Zipf's law to words and phrases
- Analysis of Stylometric Variables in Long and Short Texts
- The Evolution of Stylometry in Humanities Scholarship
- Blended Authorship Attribution: Unmasking Elena Ferrante Combining Different Author Profiling Methods
Search
Search
Search
Search
Search
Search
Search
Search
Search
4/4
1970
Le démarrage du développement technologique permet le lancement de nombreuses études pour identifier de nouveaux marqueurs de style et élaborer de nouvelles méthodes d'analyse, plus rapides et poussées puisque assistées par ordinateur.
1944
George Yule développe la "caractéristique K", une métrique associée à la distribution des occurrences des mots. Elle évalue le degré de concentration des mots les plus fréquents dans un texte. Si K est élevé, alors certains mots apparaissent très souvent, et les autres se font plus rares. C'est une façon de quantifier l'inégalité de distribution des mots dans un texte, similaire à l'idée derrière la loi de Zipf.
+info
1932
George K. Zipf, linguiste et philologue américain, démontre une relation entre le nombre d'occurrences de types de mots et leur fréquence. Soit la fréquence à laquelle certains types de mots (noms, verbes, adjectifs, adverbes, etc.) apparaissent dans un texte donné. Cette découverte conduira à la création de la première loi de Zipf.
La première loi de Zipf affirme que la fréquence d'un mot est inversement proportionnelle à son rang de fréquence. Par exemple, le mot le plus courant sera utilisé deux fois plus souvent que le deuxième mot le plus courant, trois fois plus souvent que le troisième, etc. Formant ainsi une hiérarchie entre les mots.
1990
L’analyse stylométrique fait un grand bond en avant, grâce à la diffusion des techniques de machine learning. Celles-ci permettent de mieux décrire et classer les textes en fonction de leur style. En parallèle, le développement de la communication virtuelle ouvre de nouvelles possibilités pour l'étude des textes.
1851
Date clé à partir de laquelle la stylométrie devient un outil, utilisé pour tenter d'identifier l'auteur d'un texte. Le basculement se fait grâce à l'étude d’Augustus de Morgan, mathématicien britannique, qui découvre que la longueur des mots est en réalité un véritable marqueur de style. Les origines de la stylométrie, comme outil permettant d’attribuer la paternité d’un texte, sont donc généralement associées à cette date-là.
1938
George Yule, statisticien écossais, identifie l'instabilité de la longueur des phrases comme un marqueur de style.
1963
Introduction d’une approche multivariée au niveau lexical. Ce qui signifie que désormais, les analyses en stylométrie ne se penchent plus uniquement sur une caractéristique. Frederick Mosteller et David L. Wallace, deux statisticiens américains, publient une méthode d'inférence basée sur une approche statistique bayésienne pour l'attribution d'auteurs, en se basant sur le travail du physicien américain Thomas Mendenhall (1901). Méthode qui a permis de mettre en évidence le potentiel de la stylométrie dans la pratique, mais qui sera cependant remise en question trente ans plus tard.
Cette méthodologie a notamment été utilisée pour attribuer de manière probabiliste les auteurs des Federalist Papers, une série d'articles politiques américains publiés entre 1787 et 1788 pour soutenir l'adoption de la Constitution des États-Unis. Ils ont été écrits par Alexander Hamilton, James Madison et John Jay sous le pseudonyme "Publius".
1890
Wincenty Lutosławski, philosophe polonais, utilise pour la première fois le mot stylométrie dans son travail sur la datation chronologique des dialogues de Platon.
© Crédits photos
Toutes les images sont libres de droits ou appartiennent au domaine public.
Attribution requise:
- Fond: Image by Nile from Pixabay
- Hindouisme: Image by Rhiannon from Pixabay
- Grèce: Image by Dimitris Vetsikas from Pixabay
- Bible: Image by AgnieszkaMonk from Pixabay
- Phrase: Image by PDPics from Pixabay
- Ordinateur: Image by SSidde from Pixabay
- Code: Image by Pexels from Pixabay
- Bible ancienne: Image by cgrape from Pixabay
300 av. J.-C.
Saunaka, grammairien sanskrit, réalise la première description quantitative de textes, à partir du Rig-Veda, un ancien texte religieux indien, afin d’en assurer la préservation.
180 av. J.-C.
Aristarque de Samothrace, érudit grec, célèbre pour son travail sur les textes homériques, enregistre des expressions rares ou uniques dans les textes grecs, contribuant ainsi à la philologie classique.
* auteur massorète
Un auteur massorète est un érudit juif du Moyen Âge qui contribue à la préservation et à la transmission précise du texte de la Bible hébraïque. Le travail de ces auteurs a permis une transmission fidèle des textes bibliques à travers les générations.
950 ap. J.-C.
Aaron Ben-Asher, auteur massorète*, compte différents éléments de la Bible, y compris le nombre de lettres, de mots et de phrases.
1901
Thomas Mendenhall, physicien américain, étudie le style des pièces attribuées à Shakespeare en utilisant la longueur des mots comme indicateur, pour discuter de leur authenticité.
L'origine de la stylométrie et son évolution
gmonayron
Created on August 22, 2024
Cette frise chronologique résume les étapes clés de l'évolution de la stylométrie. Elle se base sur la revue de littérature publiée dans Forensic Science International: Synergy en juin 2024, par Valentina Cammarota, Silvia Bozza, Claude-Alain Roten et Franco Taroni.
Start designing with a free template
Discover more than 1500 professional designs like these:
View
Practical Timeline
View
Timeline video mobile
View
Timeline Lines Mobile
View
Major Religions Timeline
View
Timeline Flipcard
View
Timeline video
View
History Timeline
Explore all templates
Transcript
L'origine de la stylométrie et son évolution
Premières descriptions quantitatives de textes :
Avant J.-C.
Après J.-C.
Avant J.-C.
180
300
950
J.-C.
Dans ces premiers exemples, on ne parle pas encore d'identifier l'auteur d'un texte. Mais selon le scientifique Joseph Rudman, il s'agit des premières tentatives de décrire quantitativement des textes, c’est-à-dire de les analyser en utilisant des chiffres ou des statistiques.
Ces trois figures ont joué un rôle crucial dans la préservation et l’analyse de textes religieux et littéraires phares de leur culture respective.
1/4
L'origine de la stylométrie et son évolution
XIXème siècle
1851
1890
Date clé
2/4
L'origine de la stylométrie et son évolution
XXème siècle
1938
1944
1901
1932
1963
1970
1990
De nombreux chercheurs se sont attachés à développer les connaissances en stylométrie au cours du 20ème siècle. Cependant, les études les plus connues sont celles de George K. Zipf (1932) et de George Yule (1938 & 1944).
3/4
L'origine de la stylométrie et son évolution
lectures pour aller plus loin:
Search
Search
Search
Search
Search
Search
Search
Search
Search
4/4
1970
Le démarrage du développement technologique permet le lancement de nombreuses études pour identifier de nouveaux marqueurs de style et élaborer de nouvelles méthodes d'analyse, plus rapides et poussées puisque assistées par ordinateur.
1944
George Yule développe la "caractéristique K", une métrique associée à la distribution des occurrences des mots. Elle évalue le degré de concentration des mots les plus fréquents dans un texte. Si K est élevé, alors certains mots apparaissent très souvent, et les autres se font plus rares. C'est une façon de quantifier l'inégalité de distribution des mots dans un texte, similaire à l'idée derrière la loi de Zipf.
+info
1932
George K. Zipf, linguiste et philologue américain, démontre une relation entre le nombre d'occurrences de types de mots et leur fréquence. Soit la fréquence à laquelle certains types de mots (noms, verbes, adjectifs, adverbes, etc.) apparaissent dans un texte donné. Cette découverte conduira à la création de la première loi de Zipf.
La première loi de Zipf affirme que la fréquence d'un mot est inversement proportionnelle à son rang de fréquence. Par exemple, le mot le plus courant sera utilisé deux fois plus souvent que le deuxième mot le plus courant, trois fois plus souvent que le troisième, etc. Formant ainsi une hiérarchie entre les mots.
1990
L’analyse stylométrique fait un grand bond en avant, grâce à la diffusion des techniques de machine learning. Celles-ci permettent de mieux décrire et classer les textes en fonction de leur style. En parallèle, le développement de la communication virtuelle ouvre de nouvelles possibilités pour l'étude des textes.
1851
Date clé à partir de laquelle la stylométrie devient un outil, utilisé pour tenter d'identifier l'auteur d'un texte. Le basculement se fait grâce à l'étude d’Augustus de Morgan, mathématicien britannique, qui découvre que la longueur des mots est en réalité un véritable marqueur de style. Les origines de la stylométrie, comme outil permettant d’attribuer la paternité d’un texte, sont donc généralement associées à cette date-là.
1938
George Yule, statisticien écossais, identifie l'instabilité de la longueur des phrases comme un marqueur de style.
1963
Introduction d’une approche multivariée au niveau lexical. Ce qui signifie que désormais, les analyses en stylométrie ne se penchent plus uniquement sur une caractéristique. Frederick Mosteller et David L. Wallace, deux statisticiens américains, publient une méthode d'inférence basée sur une approche statistique bayésienne pour l'attribution d'auteurs, en se basant sur le travail du physicien américain Thomas Mendenhall (1901). Méthode qui a permis de mettre en évidence le potentiel de la stylométrie dans la pratique, mais qui sera cependant remise en question trente ans plus tard.
Cette méthodologie a notamment été utilisée pour attribuer de manière probabiliste les auteurs des Federalist Papers, une série d'articles politiques américains publiés entre 1787 et 1788 pour soutenir l'adoption de la Constitution des États-Unis. Ils ont été écrits par Alexander Hamilton, James Madison et John Jay sous le pseudonyme "Publius".
1890
Wincenty Lutosławski, philosophe polonais, utilise pour la première fois le mot stylométrie dans son travail sur la datation chronologique des dialogues de Platon.
© Crédits photos
Toutes les images sont libres de droits ou appartiennent au domaine public.
Attribution requise:
300 av. J.-C.
Saunaka, grammairien sanskrit, réalise la première description quantitative de textes, à partir du Rig-Veda, un ancien texte religieux indien, afin d’en assurer la préservation.
180 av. J.-C.
Aristarque de Samothrace, érudit grec, célèbre pour son travail sur les textes homériques, enregistre des expressions rares ou uniques dans les textes grecs, contribuant ainsi à la philologie classique.
* auteur massorète
Un auteur massorète est un érudit juif du Moyen Âge qui contribue à la préservation et à la transmission précise du texte de la Bible hébraïque. Le travail de ces auteurs a permis une transmission fidèle des textes bibliques à travers les générations.
950 ap. J.-C.
Aaron Ben-Asher, auteur massorète*, compte différents éléments de la Bible, y compris le nombre de lettres, de mots et de phrases.
1901
Thomas Mendenhall, physicien américain, étudie le style des pièces attribuées à Shakespeare en utilisant la longueur des mots comme indicateur, pour discuter de leur authenticité.