Datajournalisme
B3 - Centre nantais de journalisme PIerre-Adrien Roux
Start
bit.ly/DATA-B3
Contact : rouxpierreadrien@gmail.com Programme : 2 séances de 3h + 3 séances de 2h Objectifs : S'approprier et mettre en œuvre les techniques de vérification de l'information et comprendre les limites du fact-checking Evaluation en contrôle continu (60%) : exercices de groupe Evaluation finale (40%) : écrite individuelle Ressource pédagogique : les contenus seront ouverts au fur et à mesure des séances
Infos pratiques
Contact : rouxpierreadrien@gmail.com Programme : 4 séances Objectifs : S'initier au datajournalisme et à la datavisualisation Evaluation contrôle continu (50%) : travaux de groupe Evaluation finale (50%) : interrogation écrite individuelle en dernière séance Ressource pédagogique : les contenus seront ouverts au fur et à mesure des séances
Séances
1- Qu'est-ce que le datajournalisme ?
2- Typologie de dataviz et découverte de Flourish
3- Evaluation individuelle et challenge final
Avant de démarrer, petit sondage
QR Code ou www.beekast.com (code : 438670)
01
Qu'est-ce que le datajournalisme ?
01
Qu'est-ce que le datajournalisme ?
01.1 - L'ère du Big data
Un Internet mondial en constante progression
En une minute sur Internet
Source : Tom Travel 2023
L'ère du Big data
L'avènement du web 2.0 a entrainé une massification des données sur Internet. Un like, un partage, un commentaire, un post, sont autant de datas enregistrées sur des serveurs puis rassemblés dans des data center. Notre besoin de services accessibles 24h/24 entraine la multiplication de ces données sur plusieurs serveurs. Cette accumulation de données n'est pas sans conséquences géopolitiques et environnementales.
Que fait-on de ces données ?
La gestion des données numériques est devenu un enjeu majeur dans le fonctionnement de nos sociétés. Quelques exemples :
- on les stocke pour assurer la continuité de services en ligne 24/24h partout dans le monde
- on les analyse pour orienter des stratégies politiques, économiques, commerciales...
- on les étudie pour mieux comprendre le monde : sociologie, économie, journalisme, etc.
Ainsi se sont développés de nouveaux métiers : data scientist, data analyst, datajournalisme...
Carte des data centers dans le monde
Le datajournalisme
Le datajournalisme est donc une discipline journalistique qui consiste à utiliser un ensemble de données (numériques ou non) comme sources d'information principales. Le datajournaliste travaille donc à partir d'une quantité et une diversité de données chiffrées. Le datajournalisme se distingue du journalisme traditionnel par sa capacité à récolter et analyser une grande quantité de données chiffrées afin d’en extraire ce qui fait sens et de le présenter sous forme de datavisualisation. Le datajournalisme est à la croisée de plusieurs compétence : journalisme, web design et informatique.
La datavisualisation
Une datavisualisation est une représentation graphique d'un jeu de données traité. Elle permet aux journalistes de représenter une information basée sur ces données selon un angle déterminé et en apportant parfois une interactivité, une expérience utilisateurs. Il existe plusieurs familles de datavisualisations : cartographies, timelines, infographies interactives, etc.
Emissions de CO₂
Face of nation
01
Qu'est-ce que le datajournalisme ?
01.2 - Petite histoire du datajournalisme
Les prémices de la visualisation de données
Bien avant l'avènement du datajournalisme comme discipline reconnue et structurée (deuxième moitiée du XXe siècle), on trouve nombre d'exemples de datavisualisations du côté des statisticiens, mathématiciens, ingénieurs, médecins... Dès le XVIIIe siècle, ces premières représentations graphiques vont poser les bases de certains modèles encore utilisés aujour'd'hui...
Graphiques statistiques de William Playfair (1801)
William Playfair :
- considéré comme le pionnier des graphiques statistiques. Economiste et ingénieur écossais.
- le père du graphique sectoriel, le fameux "camembert".
- Il a également popularisé les graphiques en courbes : ci-contre pour représenter les exportations et importations entre le Danemark et la Norvège entre 1700 et 1780) et les histogrammes.
Ces trois types de visualisations sont considérées aujourd'hui comme incontournable.
The statistical Breviary / Les revenus européens
Les cartes choroplèthes de Charles Dupin (1826)
Charles Dupin :
- ingénieur et mathématicien français
- réalise en 1826 la première carte choroplèthe sur le thème de l'instruction populaire en France. Cette carte représente le taux d'élèves masculins scolarisés par département. Plus le département est foncé, plus il compte d'élèves scolarisés.
Une carte choroplèthe est une carte thématique où les régions sont colorées ou remplies d'un motif qui montre une mesure statistique, tels la densité de population ou le revenu par habitant. Ce modèle est encore très utilisé aujourd'hui.
En savoir plus sur Charles Dupin
La carte par empilement de points de John Snow (1854)
John Snow :
- médecin britannique à Londres pendant l'épidémie de choléra en 1854
- pour situer l'origine de l'épidémie, il représente sur une carte, par empilement de points, le nombre de personnes malades ou décédées. Des croix symbolisent la présence de pompes à eau potables.
- en avance sur les théories microbiennes, John Snow déduit de son travail que la contamination se faisait par la consommation d'eau. La fermeture des puits a permis de mettre fin à l'épidémie.
La Coxcomb de Florence Nightingale (1858)
Florence Nightingale :
- infirmière britannique qui étudiait les statistiques
- a créé la visualisation "coxcomb" que l'on appelle aujourd'hui "rose de Nightingale"
- un format de visualisation très impactant visuellement qui permet de monter une évolution dans le temps et des parts relatives
- ci-contre sont représentées les causes de la mortalité des soldats durant la guerre de Crimée entre 1854 et 1856. Avec ce travail Florence Nightingale a démontrée que la première cause de mortalité était due au manque d'assainissement des casernes
Le diagramme Sankey de Charles Joseph Minard (1869)
Charles Joseph Minard :
- ingénieur civil français
- 1869, il publie cette représentation des pertes humaines de l'armée française pendant la campagne de Russie menée par Napoléon.
- ce modèle de représentation de flux est appellé aujourd'hui Diagramme Sankey.
Le cartogramme d'Emile Levasseur (1868)
Emile Levasseur :
- statisticien et géographe français
- a réalisé le premier cartogramme en 1868
- le cartogramme permet de redonner aux entités géographiques leur « véritable » importance visuelle en déformant les surfaces de votre carte (anamorphose) pour de les rendre proportionnelles à une donnée statistique.
- ci-contre, le cartogramme d'Emile Levasseur permet de comparer les superficies des pays européens en 1868
Naissance du "journalisme assisté par ordinateur"
Si certains travaux comme ceux de John Snow ou Florence Nightingale ont tout d'une approche de datajournaliste, il faut attendre la seconde moitié du XXe pour que cette discipline se structure dans la profession. Dans les années 1970, le professeur Philip Meyer propose la notion de « journalisme de précision » qui vise à utiliser les méthodes des sciences sociales et comportementales dans le journalisme.
En 1989, le journaliste américain Bill Dedman reçoit le Prix Pulitzer pour son étude statistique montrant que la population noire d’Atlanta obtenait moins de crédits bancaires que le population blanche. C'est un tournant et une reconnaissance pour les journalistes qui travaillent les données statistiques. On parle alors de "journalisme assisté par ordinateur".
Les journalistes face à l'explosion de données
A début des années 2000, 10 ans après la création du web, la masse de données numériques en transit sur Internet est de plus en plus importante. S'ouvre un nouveau champs de travail pour les journalistes. On parle alors de big data, datajournalisme, de datavisualisaton, de crowdsourcing... Certaines rédactions anticipent ce mouvement, comme The Guardian, et se positionnent tôt sur cette discipline. À partir de mars 2009, le journaliste Simon Rogers anime pour The Guardian le « datablog » qui coordonne les travaux relevant du journalisme de données.
Les journalistes d'investigation s'emparent des datas
Durant les années 2010, la question des données numériques confidentielles comme source d'investigation journalistique arrive au premier plan. Wikileaks, créée en 2006, révèle en 2010 tout une série de scandales liés à la Guerre en Irak. L'ONG publie une vidéo datant de 2007, où l'on voit une frappe aérienne américaine tuer par erreur deux journalistes de l'agence Reuters, puis une famille irakienne venue tenter d'aider, ce qui peut constituer un crime de guerre. La même année, les « war logs » détaillent plus de 100 000 morts en Irak, principalement civiles (plus de 66 000) ou encore des bavures au sein de la coalition internationale (près de 4 000). Ces révélations provenant de données confidentielles valent à Wikileaks et son fondateur Julian Assange d'être dans le viseur des USA depuis lors.
Lanceurs d'alerte et fuites de données
Dans le sillage de Wikileaks, plusieurs lanceurs d'alerte vont libérer des données à l'origine de révélations fracassantes : 2012 : le Cablegate 2013 : Chinaleaks 2013 : Edward Snowden et la NSA 2014 : LuxLeaks 2015 : Swissleaks 2016 : Panama papers 2021 : Pandora Papers Le 14 avril 2014, l’édition américaine du Guardian et le Washington Post se voient décerner le Prix Pulitzer pour la publication des révélations sur le système de surveillance de la NSA, rendues possibles grâce aux documents fournis par Snowden..
Tout comprendre aux Swissleaks
Marqueur d'une profession en mutation
Face à cette masse de données à l'échelle mondiale, les rédactions sont obligés de mutualiser leur travail pour vérifier, recouper et traiter les données qui leur parviennent. A partir de 2017, le Consortium international des journalistes d'investigation (ICIJ) compte plus de 200 membres journalistes dans 70 pays qui collaborent autour de jeux de données fournis par des lanceurs d'alerte. Au-delà de coopération entre journalistes dans le traitement et la diffusion d'informations, les professionnels ont dû également apprendre à collaborer avec d'autres professions : informaticiens, statisticiens, graphistes, web designers...
Découvrez l'activité de l'ICIJ
Les dataviz toujours plus présentes dans les médias
A l'heure où la circulation de l'information est extrêmement intense et rapide, la datavisualisation apparait comme un outil pour capter l'attention des lecteurs et internautes. La datavisualisation permet de cerner un sujet en un clin d'œil tout en tout en offrant la possibilité au lecteur de le creuser. Avec cette manière de présenter l'information, les médias offre une nouvelle expérience utilisateur. Toujours plus immersive, intuitive et personnalisée.
Le datajournalisme dans les rédactions françaises
Il n'y a que très peu de médias spécialisés dans le datajournalisme en France. Deux exemples marquants :
- OWNI, média pionnier dès les années 2000, reste encore une référence malgré sa fermeture en 2012.
- L'émission Datagueule a par la suite contribué à populariser le datajournalisme à l'aide d'animations vidéo.
La discipline est toutefois présente dans les rédactions :
- appartenance du Monde au Consortium international des journalistes d'investigation
- services spécialisés comme Les Décodeurs du Monde
- présence régèlère de datavisulations dans la presse écrite (Courrier international, Libération...)
découvrez WeDodata
Datalgo sur Twitch
Clara Dealberto sur Twitter
La datavisualisation : la forme au service du fond
Dans un contexte de surcharge informationnelle, la datavisualisation apparait comme un outil précieux pour les journalistes en vue "d'accrocher" l'attention public. En cela, le datajournalisme est un marqueur d'une évolution plus globale de la sphère de l'information. Au fil des années est apparue la nécessité de proposer un accès simple, intuitif, visuel, interactif voire ludique aux contenus sans pour autant nuire à l'information en en tant que telle. Ces dernières années, les datajournalistes se sont rapprochés des web designer pour penser des contenus favorisant l'expérience utilisateur .
01
Qu'est-ce que le datajournalisme ?
01.3 - Vivre une expérience informationnelle avec les datas
Vie carcérale : toutes les données sur le même plan
Elections : les résultats en datavisualisation
Manifestations : à chacun ses sources
La carte des manifestations du samedi 11 février 2023 contre la réforme des retraites Les Décodeurs / Le Monde
Hip-hop : une culture mondiale
Global Hip-Hop » est un globe musical réalisé avec Clara Dealberto pour Goum Prod : il vous propose une promenade géographique dans le hip-hop mondial, avec plus de 125 pays et 311 villes représentées
Cartographie, scrollytelling et datavisualisation
Parité : un outil pour comparer les datas femmes / hommes
Le déréglement climatique en mode data
Le dérègelement climatique en Europe : comment le mesurer ? Consultez la Data Station pour en savoir plus.
Présidentielles : l'évolution des sondages en sons
Violences policières : renforcer l'impact visuel
Elon Musk : une dérive politique passée au crible
8 mars : un dossier data sur les femmes "puissantes"
Data is beautiful !
01
Qu'est-ce que le datajournalisme ?
01.4 - Où trouver des données
Deux catégories de données
Les données qualitatives :
- nominales décrivent une catégorie, elles n'ont pas d'ordre précis, pas de hiérarchie. Ex : le type de profession ou le sexe, l'ordre de présentation des données n'a pas d'importance.
- ordinales sont des données qui peuvent être classées dans un ordre spécifique (croissant ou décroissant). Ex : le degré de satisfaction par rapport à un produit
Les données quantitatives :
- continues comme la distance, l'âge, la température... Ces données sont supposées infinies.
- discrètes comme la note donnée par un professeur se situant entre 0 et 20.
Différentes sources pour trouver des données
Les données recherchées peuvent provenir de plusieurs sources :
- les plateformes d'institutions qui libèrent des données (data.gouv, Insee, collectivités, SNCF...)
- les interlocuteurs privilégies dans ces institutions qui ont accès à des jeux de données qui ne sont pas libres
- l'aspiration de données auprès de plusieurs sites web (le scrapping)
- la construction de son propre jeu de données par le biais d'une enquête.
Attention : un journaliste vérifier toujours ses sources. Si les données d'un site open data sont obsolètes, il est d'usage de contacter l'institution concernée pour lui demander de mettre à jour les données en question. Si les données proviennent d'un interlocuteur : quelle est sa fiabilité ?
Les plateformes open data
10 sites Open data
02
Typologie de dataviz et découverte de Flourish
Quiz time !
QR Code ou www.beekast.live (code : 438670)
02
Typologie de dataviz et découverte de Flourish
02.1 - Six familles de dataviz
Six objectifs : six familles de dataviz
Comparer des données de plusieurs catégories Représenter des proportions Représenter des données dans le temps Représenter des relations de données Représenter une répartition de données Représenter des données géographiquement
Comparer des données par catégorie
Barres multiples
Barres
Barres empilées
Graphique en pente
Pyramides
Barres radiales
Comparer des données par catégorie
Bulles
Barres verticales circulaires
Comparer des données par catégorie
Carte de chaleur
Nuages de mots
The Python Graph Gallery
Graphique de Sankey
Représenter des proportions
Graphique sectoriel
Graphique sectoriel en anneau
Rose de Nightingale
Graphique en hémicycle
Do not matrix chart
Représenter des proportions
Diagramme de Voronoï
Treemap
Représenter des valeurs dans le temps
Courbes
Courbes par zone
Streamgraph
Histogramme
Représenter des relations entre des valeurs
Nuage de points
Diagramme de Venn
Diagramme de Venn
Diagramme radar
Représenter une répartition entre les données
Tube map
Représenter une répartition entre les données
La boîte à moustaches
Groupement de points
Représenter les données géographiques
Carte Choroplèthe
Cartogramme géométrique
Représenter les données géographiques
Anamorphose géographique
Cartogramme de Dorling
02
Typologie de dataviz et découverte de Flourish
02.2 - Découverte de Flourish
Un outil complet pour visualiser des données
"Flourish est conçu pour aider les rédactions à accroître la qualité et la quantité de leurs articles basés sur des données. Mis au point par le studio de données londonien Kiln, Flourish offre des modèles de visualisation de données. Vous pouvez personnaliser les modèles disponibles sans savoir coder. Google News Initiative s’est associé avec Flourish pour offrir l’outil gratuitement aux rédactions.
Se créer un compte
Source
On s'exerce avec quatre formes de dataviz
- Un graphique en ligne pour visualiser l'évolution de la population mondiale depuis 1950
- Une carte choroplèthe pour visualiser le taux de chômage par régions en France au dernier trimestre 2022
- Un diagramme à barres empilées (bar chart stacked) pour visualiser la participation aux élections présidentielles de 2022 par tranches d'âges
- Un graphique en barres dynamiques (Bar chart race ) pour visualiser l'évolution de la part de la population des régions du mondes dans la populartion mondiale
Niveau 1 : le graphique en ligne
Sujet : l'évolution de la population mondiale depuis 1950.
DATASET
Niveau 2 : la carte choroplèthe
Sujet : le taux de chômage par régions en France métropolitaine fin 2025
DATASET
Niveau 3 : le diagramme en barres empilées
Sujet : la participation aux élections présidentielles 2022 par tranches d'âges
DATASET
Niveau 4 : le diagramme en barres dynamiques
Sujet : la part de la population des régions du monde dans la population mondiale
DATASET
02
Typologie de dataviz et découverte de Flourish
02.3 - Présentation du challenge final
Lancement du challenge final
En séance 3, vous devez produire une datavalisation comprenant au moins cinq entrées différentes en utilisant Flourish. Vous travaillerez en binôme sur un sujet de société de votre choix. Les étapes :
- Déterminez ( et faites valider) votre sujet
- Recherchez des données chiffrées.
- Mettez en commun ces données et déterminez l'angle de votre datavisualisation
- Déterminez les formes et contenus présents dans votre datavisualisation
- Réalisez au moins quatre datavisualisations
- Regroupez vos contenus dans uns Story Flourish. Attention : pour cela, vous devez tout réaliser sur le même compte Flourish.
- Indiquez le lien de votre story dans le tableau de bord.
tableau de bord
Deadline : 6 mars 2026
B3 CNJ - Datajournalisme 2025-26
Pierre-Adrien Roux
Created on February 4, 2026
Start designing with a free template
Discover more than 1500 professional designs like these:
View
Smart Presentation
View
Practical Presentation
View
Essential Presentation
View
Akihabara Presentation
View
Flow Presentation
View
Dynamic Visual Presentation
View
Pastel Color Presentation
Explore all templates
Transcript
Datajournalisme
B3 - Centre nantais de journalisme PIerre-Adrien Roux
Start
bit.ly/DATA-B3
Contact : rouxpierreadrien@gmail.com Programme : 2 séances de 3h + 3 séances de 2h Objectifs : S'approprier et mettre en œuvre les techniques de vérification de l'information et comprendre les limites du fact-checking Evaluation en contrôle continu (60%) : exercices de groupe Evaluation finale (40%) : écrite individuelle Ressource pédagogique : les contenus seront ouverts au fur et à mesure des séances
Infos pratiques
Contact : rouxpierreadrien@gmail.com Programme : 4 séances Objectifs : S'initier au datajournalisme et à la datavisualisation Evaluation contrôle continu (50%) : travaux de groupe Evaluation finale (50%) : interrogation écrite individuelle en dernière séance Ressource pédagogique : les contenus seront ouverts au fur et à mesure des séances
Séances
1- Qu'est-ce que le datajournalisme ?
2- Typologie de dataviz et découverte de Flourish
3- Evaluation individuelle et challenge final
Avant de démarrer, petit sondage
QR Code ou www.beekast.com (code : 438670)
01
Qu'est-ce que le datajournalisme ?
01
Qu'est-ce que le datajournalisme ?
01.1 - L'ère du Big data
Un Internet mondial en constante progression
En une minute sur Internet
Source : Tom Travel 2023
L'ère du Big data
L'avènement du web 2.0 a entrainé une massification des données sur Internet. Un like, un partage, un commentaire, un post, sont autant de datas enregistrées sur des serveurs puis rassemblés dans des data center. Notre besoin de services accessibles 24h/24 entraine la multiplication de ces données sur plusieurs serveurs. Cette accumulation de données n'est pas sans conséquences géopolitiques et environnementales.
Que fait-on de ces données ?
La gestion des données numériques est devenu un enjeu majeur dans le fonctionnement de nos sociétés. Quelques exemples :
- on les stocke pour assurer la continuité de services en ligne 24/24h partout dans le monde
- on les analyse pour orienter des stratégies politiques, économiques, commerciales...
- on les étudie pour mieux comprendre le monde : sociologie, économie, journalisme, etc.
Ainsi se sont développés de nouveaux métiers : data scientist, data analyst, datajournalisme...Carte des data centers dans le monde
Le datajournalisme
Le datajournalisme est donc une discipline journalistique qui consiste à utiliser un ensemble de données (numériques ou non) comme sources d'information principales. Le datajournaliste travaille donc à partir d'une quantité et une diversité de données chiffrées. Le datajournalisme se distingue du journalisme traditionnel par sa capacité à récolter et analyser une grande quantité de données chiffrées afin d’en extraire ce qui fait sens et de le présenter sous forme de datavisualisation. Le datajournalisme est à la croisée de plusieurs compétence : journalisme, web design et informatique.
La datavisualisation
Une datavisualisation est une représentation graphique d'un jeu de données traité. Elle permet aux journalistes de représenter une information basée sur ces données selon un angle déterminé et en apportant parfois une interactivité, une expérience utilisateurs. Il existe plusieurs familles de datavisualisations : cartographies, timelines, infographies interactives, etc.
Emissions de CO₂
Face of nation
01
Qu'est-ce que le datajournalisme ?
01.2 - Petite histoire du datajournalisme
Les prémices de la visualisation de données
Bien avant l'avènement du datajournalisme comme discipline reconnue et structurée (deuxième moitiée du XXe siècle), on trouve nombre d'exemples de datavisualisations du côté des statisticiens, mathématiciens, ingénieurs, médecins... Dès le XVIIIe siècle, ces premières représentations graphiques vont poser les bases de certains modèles encore utilisés aujour'd'hui...
Graphiques statistiques de William Playfair (1801)
William Playfair :
- considéré comme le pionnier des graphiques statistiques. Economiste et ingénieur écossais.
- le père du graphique sectoriel, le fameux "camembert".
- Il a également popularisé les graphiques en courbes : ci-contre pour représenter les exportations et importations entre le Danemark et la Norvège entre 1700 et 1780) et les histogrammes.
Ces trois types de visualisations sont considérées aujourd'hui comme incontournable.The statistical Breviary / Les revenus européens
Les cartes choroplèthes de Charles Dupin (1826)
Charles Dupin :
- ingénieur et mathématicien français
- réalise en 1826 la première carte choroplèthe sur le thème de l'instruction populaire en France. Cette carte représente le taux d'élèves masculins scolarisés par département. Plus le département est foncé, plus il compte d'élèves scolarisés.
Une carte choroplèthe est une carte thématique où les régions sont colorées ou remplies d'un motif qui montre une mesure statistique, tels la densité de population ou le revenu par habitant. Ce modèle est encore très utilisé aujourd'hui.En savoir plus sur Charles Dupin
La carte par empilement de points de John Snow (1854)
John Snow :
La Coxcomb de Florence Nightingale (1858)
Florence Nightingale :
Le diagramme Sankey de Charles Joseph Minard (1869)
Charles Joseph Minard :
Le cartogramme d'Emile Levasseur (1868)
Emile Levasseur :
Naissance du "journalisme assisté par ordinateur"
Si certains travaux comme ceux de John Snow ou Florence Nightingale ont tout d'une approche de datajournaliste, il faut attendre la seconde moitié du XXe pour que cette discipline se structure dans la profession. Dans les années 1970, le professeur Philip Meyer propose la notion de « journalisme de précision » qui vise à utiliser les méthodes des sciences sociales et comportementales dans le journalisme.
En 1989, le journaliste américain Bill Dedman reçoit le Prix Pulitzer pour son étude statistique montrant que la population noire d’Atlanta obtenait moins de crédits bancaires que le population blanche. C'est un tournant et une reconnaissance pour les journalistes qui travaillent les données statistiques. On parle alors de "journalisme assisté par ordinateur".
Les journalistes face à l'explosion de données
A début des années 2000, 10 ans après la création du web, la masse de données numériques en transit sur Internet est de plus en plus importante. S'ouvre un nouveau champs de travail pour les journalistes. On parle alors de big data, datajournalisme, de datavisualisaton, de crowdsourcing... Certaines rédactions anticipent ce mouvement, comme The Guardian, et se positionnent tôt sur cette discipline. À partir de mars 2009, le journaliste Simon Rogers anime pour The Guardian le « datablog » qui coordonne les travaux relevant du journalisme de données.
Les journalistes d'investigation s'emparent des datas
Durant les années 2010, la question des données numériques confidentielles comme source d'investigation journalistique arrive au premier plan. Wikileaks, créée en 2006, révèle en 2010 tout une série de scandales liés à la Guerre en Irak. L'ONG publie une vidéo datant de 2007, où l'on voit une frappe aérienne américaine tuer par erreur deux journalistes de l'agence Reuters, puis une famille irakienne venue tenter d'aider, ce qui peut constituer un crime de guerre. La même année, les « war logs » détaillent plus de 100 000 morts en Irak, principalement civiles (plus de 66 000) ou encore des bavures au sein de la coalition internationale (près de 4 000). Ces révélations provenant de données confidentielles valent à Wikileaks et son fondateur Julian Assange d'être dans le viseur des USA depuis lors.
Lanceurs d'alerte et fuites de données
Dans le sillage de Wikileaks, plusieurs lanceurs d'alerte vont libérer des données à l'origine de révélations fracassantes : 2012 : le Cablegate 2013 : Chinaleaks 2013 : Edward Snowden et la NSA 2014 : LuxLeaks 2015 : Swissleaks 2016 : Panama papers 2021 : Pandora Papers Le 14 avril 2014, l’édition américaine du Guardian et le Washington Post se voient décerner le Prix Pulitzer pour la publication des révélations sur le système de surveillance de la NSA, rendues possibles grâce aux documents fournis par Snowden..
Tout comprendre aux Swissleaks
Marqueur d'une profession en mutation
Face à cette masse de données à l'échelle mondiale, les rédactions sont obligés de mutualiser leur travail pour vérifier, recouper et traiter les données qui leur parviennent. A partir de 2017, le Consortium international des journalistes d'investigation (ICIJ) compte plus de 200 membres journalistes dans 70 pays qui collaborent autour de jeux de données fournis par des lanceurs d'alerte. Au-delà de coopération entre journalistes dans le traitement et la diffusion d'informations, les professionnels ont dû également apprendre à collaborer avec d'autres professions : informaticiens, statisticiens, graphistes, web designers...
Découvrez l'activité de l'ICIJ
Les dataviz toujours plus présentes dans les médias
A l'heure où la circulation de l'information est extrêmement intense et rapide, la datavisualisation apparait comme un outil pour capter l'attention des lecteurs et internautes. La datavisualisation permet de cerner un sujet en un clin d'œil tout en tout en offrant la possibilité au lecteur de le creuser. Avec cette manière de présenter l'information, les médias offre une nouvelle expérience utilisateur. Toujours plus immersive, intuitive et personnalisée.
Le datajournalisme dans les rédactions françaises
Il n'y a que très peu de médias spécialisés dans le datajournalisme en France. Deux exemples marquants :
- OWNI, média pionnier dès les années 2000, reste encore une référence malgré sa fermeture en 2012.
- L'émission Datagueule a par la suite contribué à populariser le datajournalisme à l'aide d'animations vidéo.
La discipline est toutefois présente dans les rédactions :découvrez WeDodata
Datalgo sur Twitch
Clara Dealberto sur Twitter
La datavisualisation : la forme au service du fond
Dans un contexte de surcharge informationnelle, la datavisualisation apparait comme un outil précieux pour les journalistes en vue "d'accrocher" l'attention public. En cela, le datajournalisme est un marqueur d'une évolution plus globale de la sphère de l'information. Au fil des années est apparue la nécessité de proposer un accès simple, intuitif, visuel, interactif voire ludique aux contenus sans pour autant nuire à l'information en en tant que telle. Ces dernières années, les datajournalistes se sont rapprochés des web designer pour penser des contenus favorisant l'expérience utilisateur .
01
Qu'est-ce que le datajournalisme ?
01.3 - Vivre une expérience informationnelle avec les datas
Vie carcérale : toutes les données sur le même plan
Elections : les résultats en datavisualisation
Manifestations : à chacun ses sources
La carte des manifestations du samedi 11 février 2023 contre la réforme des retraites Les Décodeurs / Le Monde
Hip-hop : une culture mondiale
Global Hip-Hop » est un globe musical réalisé avec Clara Dealberto pour Goum Prod : il vous propose une promenade géographique dans le hip-hop mondial, avec plus de 125 pays et 311 villes représentées
Cartographie, scrollytelling et datavisualisation
Parité : un outil pour comparer les datas femmes / hommes
Le déréglement climatique en mode data
Le dérègelement climatique en Europe : comment le mesurer ? Consultez la Data Station pour en savoir plus.
Présidentielles : l'évolution des sondages en sons
Violences policières : renforcer l'impact visuel
Elon Musk : une dérive politique passée au crible
8 mars : un dossier data sur les femmes "puissantes"
Data is beautiful !
01
Qu'est-ce que le datajournalisme ?
01.4 - Où trouver des données
Deux catégories de données
Les données qualitatives :
- nominales décrivent une catégorie, elles n'ont pas d'ordre précis, pas de hiérarchie. Ex : le type de profession ou le sexe, l'ordre de présentation des données n'a pas d'importance.
- ordinales sont des données qui peuvent être classées dans un ordre spécifique (croissant ou décroissant). Ex : le degré de satisfaction par rapport à un produit
Les données quantitatives :Différentes sources pour trouver des données
Les données recherchées peuvent provenir de plusieurs sources :
- les plateformes d'institutions qui libèrent des données (data.gouv, Insee, collectivités, SNCF...)
- les interlocuteurs privilégies dans ces institutions qui ont accès à des jeux de données qui ne sont pas libres
- l'aspiration de données auprès de plusieurs sites web (le scrapping)
- la construction de son propre jeu de données par le biais d'une enquête.
Attention : un journaliste vérifier toujours ses sources. Si les données d'un site open data sont obsolètes, il est d'usage de contacter l'institution concernée pour lui demander de mettre à jour les données en question. Si les données proviennent d'un interlocuteur : quelle est sa fiabilité ?Les plateformes open data
10 sites Open data
02
Typologie de dataviz et découverte de Flourish
Quiz time !
QR Code ou www.beekast.live (code : 438670)
02
Typologie de dataviz et découverte de Flourish
02.1 - Six familles de dataviz
Six objectifs : six familles de dataviz
Comparer des données de plusieurs catégories Représenter des proportions Représenter des données dans le temps Représenter des relations de données Représenter une répartition de données Représenter des données géographiquement
Comparer des données par catégorie
Barres multiples
Barres
Barres empilées
Graphique en pente
Pyramides
Barres radiales
Comparer des données par catégorie
Bulles
Barres verticales circulaires
Comparer des données par catégorie
Carte de chaleur
Nuages de mots
The Python Graph Gallery
Graphique de Sankey
Représenter des proportions
Graphique sectoriel
Graphique sectoriel en anneau
Rose de Nightingale
Graphique en hémicycle
Do not matrix chart
Représenter des proportions
Diagramme de Voronoï
Treemap
Représenter des valeurs dans le temps
Courbes
Courbes par zone
Streamgraph
Histogramme
Représenter des relations entre des valeurs
Nuage de points
Diagramme de Venn
Diagramme de Venn
Diagramme radar
Représenter une répartition entre les données
Tube map
Représenter une répartition entre les données
La boîte à moustaches
Groupement de points
Représenter les données géographiques
Carte Choroplèthe
Cartogramme géométrique
Représenter les données géographiques
Anamorphose géographique
Cartogramme de Dorling
02
Typologie de dataviz et découverte de Flourish
02.2 - Découverte de Flourish
Un outil complet pour visualiser des données
"Flourish est conçu pour aider les rédactions à accroître la qualité et la quantité de leurs articles basés sur des données. Mis au point par le studio de données londonien Kiln, Flourish offre des modèles de visualisation de données. Vous pouvez personnaliser les modèles disponibles sans savoir coder. Google News Initiative s’est associé avec Flourish pour offrir l’outil gratuitement aux rédactions.
Se créer un compte
Source
On s'exerce avec quatre formes de dataviz
Niveau 1 : le graphique en ligne
Sujet : l'évolution de la population mondiale depuis 1950.
DATASET
Niveau 2 : la carte choroplèthe
Sujet : le taux de chômage par régions en France métropolitaine fin 2025
DATASET
Niveau 3 : le diagramme en barres empilées
Sujet : la participation aux élections présidentielles 2022 par tranches d'âges
DATASET
Niveau 4 : le diagramme en barres dynamiques
Sujet : la part de la population des régions du monde dans la population mondiale
DATASET
02
Typologie de dataviz et découverte de Flourish
02.3 - Présentation du challenge final
Lancement du challenge final
En séance 3, vous devez produire une datavalisation comprenant au moins cinq entrées différentes en utilisant Flourish. Vous travaillerez en binôme sur un sujet de société de votre choix. Les étapes :
tableau de bord
Deadline : 6 mars 2026