sensibilisation à la science ouverte
Les données de la recherche
Un principe : « Aussi ouvert que possible, aussi fermé que nécessaire »
Formation en ligne des bibliothèques d'Aix-Marseille Université
Source : Ouvrir la science
Les données de la recherche
2. Exemples de données
1. Définition
4. Pourquoi gérer des données ?
3. Enjeux
6. Principes FAIR
5. Le cycle des données
7. Plan de gestion des données
8. Quiz
Sommaire
9. Ressources à consulter
Les données de la recherche
Les données de la recherche
1. Définition :
LES DONNÉES DE LA RECHERCHE « Les données de la recherche sont définies comme des enregistrements factuels (chiffres, textes, images, sons, etc.), qui sont utilisés comme sources principales pour la recherche scientifique et sont généralement reconnus par la communauté scientifique comme nécessaires pour valider les résultats de la recherche. »
Source : Organisation de coopération et de développement économiques - OCDE
Les données de la recherche
2. Exemples de données issues de la recherche
Source : Le Réservoar, 2020
Les données de la recherche
3. Enjeux
Ouvrir vos jeux de données vous permet :
d'augmenter la visibilité de vos travaux
d'être davantage cité
de répondre à une obligation prévue par la "Loi pour une République numérique"
de faire naître de nouvelles collaborations
de favoriser la transparence et l’éthique de la recherche, de garantir l’intégrité de la recherche, pour vous prémunir de la fraude scientifique
Source : Ouvrir la science
Les données de la recherche
4. Pourquoi gérer vos données de la recherche ?
En cas de non gestion des données, de nombreuses difficultés sont rencontrées par les chercheurs :
Perte des données au moment où un chercheur quitte le laboratoire.
Impossibilité de reproduire les résultats d’une recherche scientifique car les données et le code ne sont pas accessibles ou sont mal documentés et non réutilisables.
Pratiques de stockage dispersées, volatiles sans garantie de pérennité (disque dur, clé USB, cloud etc.).
Absence de solution pour stocker et ouvrir de manière pérenne des données collectées lors d’un projet de recherche.
Source : Recherche Data Gouv
Les données de la recherche
5. Le cycle de vie de la donnée
Une bonne gestion des données est utile pour soi et pour les autres.Anticipée et planifiée dès le début de la recherche, elle permet de retrouver facilement ses données, de les rendre accessibles et réutilisables par d’autres. À l’issue d'un projet de recherche, elle facilite l’archivage et la diffusion des jeux de données.
Collecte
Mise en accès
Description
Archivage
Stockage
Source : Passeport pour la science ouverte
Traitement et analyse
Ce schéma provient de la 1ère édition du "Passeport pour la science" parue en juillet 2020.
Les données de la recherche
6. Les Principes FAIR
"Ensemble de principes directeurs pour gérer les données de la recherche."
Requiert une description et une indexation des données et métadonnées
Facile à trouver
Faciliter leur accès et/ou téléchargement en spécifiant les conditions d'accès
Accessible
Téléchargeable, utilisable, intelligible et combinable avec d'autres données, par des humains et des machines
Interopérable
Met en avant les caractéristiques qui rendent les données réutilisables pour de futures recherches ou d'autres finalités
Réutilisable
+ info
Source : Ouvrir la science : principes FAIR
Les données de la recherche
7. UN OUTIL : Le plan de gestion des données
Exemple d'un PGD ou DMP
C'est un document synthétique qui aide à organiser et anticiper toutes les étapes du cycle de vie de la donnée. Il explique pour chaque jeu de données comment seront gérées les données d’un projet, depuis leur création ou collecte jusqu’à leur partage et leur archivage.
Aspect financier
Le DMP (Data Management Plan) ou PGD (Plan de gestion des données) est évolutif et peut être un livrable exigé par certains financeurs tels que l'ANR ou la Commission européenne.
Dès le début de votre thèse, une aide précieuse
en savoir +
Source : Science ouverte COUPERIN
Les données de la recherche
Et maintenant, à vous de jouer !
Testez vos connaissances sur les données de la recherche.
Commencer
Les données de la recherche
1/2
Comment s'appelle l'outil de gestion dédié aux données de la recherche ?
Le PGD
Le RGPD
Le PGCD
Les données de la recherche
Correct
Le PGD (ou plan de gestion des données) explique comment vont être gérées du début à la fin du projet et au-délà, les données produites ou collectées durant le projet de recherche ou de la thèse.
Continuer
Les données de la recherche
2/2
À quels principes doivent obéir les données de la recherche, principes résumés sous l’acronyme FAIR ?
Glisser les réponses correctes vers la colonne de droite
Réparable
Institutionnel
Accessible
Fiable
Interopérable
Informel
Facile à trouver
Rare
Agréable
Automatique
Réutilisable
International
Fondamental
ressources
solution
Les données de la recherche
Quelques ressources à consulter
terminer
Sensibilisation à la science ouverte
Parcours de la formation
VI. Vers les sciences citoyennes et participatives
IV. Les données de la recherche
II. Introduction
VIII. Conclusion
I. Préambule
V. Soutien à la bibliodiversité
VII. Évaluation par les pairs
III. Diffuser ses publications
continuer
Les données de la recherche
Faux !
Réessayez !
Nouvel essai
Le rapport de la Commission européenne Cost of not having FAIR research data paru en 2019 estime que le coût de la mauvaise gestion des données de la recherche se chiffre à 3 milliards d’euros pour la France, en raison des pertes de temps, de la non optimisation des coûts de stockage, des frais de licence, des problèmes de duplication de la recherche, du manque de fertilisation croisée. Pour lire le rapport : Cost of not having FAIR research data
La question des données est un sujet stratégique, qui a fait l’objet d’un rapport demandé par le Premier ministre au député Éric Bothorel, « Pour une politique publique de la donnée » paru en décembre 2020. Il rappelle fortement les enjeux autour des données scientifiques comme vecteurs de connaissance.Pour en savoir plus : "Rapport Bothorel : pour une nouvelle ère de la politique publique de la donnée".
La gestion des données et le cycle de vie des données de la recherche
Cette vidéo (5'09) vous permet de comprendre en quoi une bonne gestion des données est utile pour vous et pour la communauté scientifique. Vous découvrez quelles questions vous poser pour organiser au mieux les données de la recherche tout au long de leur cycle de vie et les bénéfices d’une telle gestion, notamment en matière de partage et de réutilisation des données. Ces enjeux sont illustrés par le témoignage d’Egon Heuson, chargé de recherche à Centrale Lille.
Pour la visionner :https://www.canal-u.tv/chaines/ouvrirlascience/la-gestion-des-donnees-et-le-cycle-de-vie-des-donnees-de-la-recherche
INRAE a construit un plan « Données pour la science » (2022-2024), afin de mieux utiliser et de partager les données scientifiques grâce au développement du numérique. Ce plan implique une transformation systémique des pratiques et mobilise l’ensemble de l’Institut, pour favoriser une science plus ouverte, interdisciplinaire et prédictive. Pour en savoir plus : "Exploiter et partager les données scientifiques, moteur de la recherche", interview de deux acteurs clés de cette évolution, Michaël Chelle, chargé de mission « numérique » auprès de Carole Caranta (directrice générale déléguée Science et Innovation) et Hadi Quesneville, administrateur des données, algorithmes et codes.
Voici les bonnes réponses
FAIR
Facile à trouver
Accessible
Interopérable
Réutilisable
(Findable, Accessible, Interoperable, Reusable)
Pour en savoir plus, aller sur la page dédiée du CCSD.
En quelques minutes, la chargée de mission de la cellule science ouverte du SCD d'Aix-marseille vous présente comment créer votre plan de gestion des données.
Jeux de données
Un jeu de données est un ensemble de données ayant une cohérence intellectuelle, qu’elle soit dans l’intention ou dans la forme. Collectées et/ou produites, les données qui le composent peuvent être de nature différente (textes, chiffres, images fixes ou animées, sons, etc.). Par exemple, une photographie d’un champ, une analyse de sa terre et un relevé hygrométrique de ce champ peuvent constituer un jeu de données cohérent intellectuellement, même s’il est composé d’objets hétérogènes.
Source : GTSO Données de Couperin
Ce qu'il faut retenir de la loi République numérique
Favoriser la circulation des données et du savoir (Titre I) (Source : Pour une république numérique ?)
Ouverture par défaut des données publiques et des données d’intérêt général :La loi crée l’obligation pour les organismes publics de communiquer gratuitement en ligne leurs bases de données, sous réserve d’anonymisation et de protection du secret industriel et commercial, qui pourront ainsi être exploitées et réutilisées facilement par un particulier. Certains acteurs privés (entreprises titulaires des marchés publics, bénéficiaires de subventions publiques…) seront également tenus de communiquer des données d’intérêt général qui pourront concerner l’exploitation des services publics de transports, les transactions immobilières, ou encore la gestion et le recyclage des déchets. Les données issues de travaux de recherche scientifique financées par la puissance publique pourront également être accessibles librement après une courte période.
Article L533-4 dans le Chapitre III du Code de la recherche : La valorisation des résultats de la recherche par les établissements et organismes de recherche : I.-Lorsqu'un écrit scientifique issu d'une activité de recherche financée au moins pour moitié par des dotations de l'Etat est publié, [...] son auteur dispose, même après avoir accordé des droits exclusifs à un éditeur, du droit de mettre à disposition gratuitement dans un format ouvert, par voie numérique, [...] la version finale de son manuscrit acceptée pour publication, dès lors que l'éditeur met lui-même celle-ci gratuitement à disposition par voie numérique ou, à défaut, à l'expiration d'un délai courant à compter de la date de la première publication. [...]Pour en savoir plus, consultez legifrance.
La gestion des données de la recherche à amU
Page dédiée à CEDRE, structure de service et de recherche transversale.
Page dédiée aux données de la recherche par la Cellule Science Ouverte du Service commun de la documentation (les BU).
Page Science ouverte du guide pratique à destination des unités de recherche d'Aix-Marseille Université.
À l’Université d’Aix-Marseille, le service commun de documentation (les bibliothèques universitaires) pilote le projet "données de recherche" par l’intermédiaire de sa cellule science ouverte. Un comité de pilotage associe les acteurs et services qui travaillent en appui aux chercheurs, tels que la direction et la valorisation de la recherche, la direction du système d’information, la cellule Europe… L’accompagnement des chercheurs et des doctorants passe par la mise en place de canaux de communication dédiés, la sensibilisation et la formation, et l’appui à la rédaction de plans de gestion des données. Si vous souhaitez en savoir plus : "La gestion des données à Aix-Marseille" Le site couperin de la science ouverte en France
Si vous souhaitez comprendre les obligations des financeurs en matière de gestion des données de recherche et connaître pour chaque financeur les exigences ou non en matière de plan de gestion de données, stockage et partage des données issues des projets qu’il finance, n'hésitez pas à consulter le lien ci-dessous : Les exigences des financeurs, Doranum
2025-2026 - SO IV. Les données de la recherche
SCD
Created on March 18, 2025
Start designing with a free template
Discover more than 1500 professional designs like these:
View
Essential Learning Unit
View
Akihabara Learning Unit
View
Genial learning unit
View
History Learning Unit
View
Primary Unit Plan
View
Vibrant Learning Unit
View
Art learning unit
Explore all templates
Transcript
sensibilisation à la science ouverte
Les données de la recherche
Un principe : « Aussi ouvert que possible, aussi fermé que nécessaire »
Formation en ligne des bibliothèques d'Aix-Marseille Université
Source : Ouvrir la science
Les données de la recherche
2. Exemples de données
1. Définition
4. Pourquoi gérer des données ?
3. Enjeux
6. Principes FAIR
5. Le cycle des données
7. Plan de gestion des données
8. Quiz
Sommaire
9. Ressources à consulter
Les données de la recherche
Les données de la recherche
1. Définition :
LES DONNÉES DE LA RECHERCHE « Les données de la recherche sont définies comme des enregistrements factuels (chiffres, textes, images, sons, etc.), qui sont utilisés comme sources principales pour la recherche scientifique et sont généralement reconnus par la communauté scientifique comme nécessaires pour valider les résultats de la recherche. »
Source : Organisation de coopération et de développement économiques - OCDE
Les données de la recherche
2. Exemples de données issues de la recherche
Source : Le Réservoar, 2020
Les données de la recherche
3. Enjeux
Ouvrir vos jeux de données vous permet :
d'augmenter la visibilité de vos travaux
d'être davantage cité
de répondre à une obligation prévue par la "Loi pour une République numérique"
de faire naître de nouvelles collaborations
de favoriser la transparence et l’éthique de la recherche, de garantir l’intégrité de la recherche, pour vous prémunir de la fraude scientifique
Source : Ouvrir la science
Les données de la recherche
4. Pourquoi gérer vos données de la recherche ?
En cas de non gestion des données, de nombreuses difficultés sont rencontrées par les chercheurs :
Perte des données au moment où un chercheur quitte le laboratoire.
Impossibilité de reproduire les résultats d’une recherche scientifique car les données et le code ne sont pas accessibles ou sont mal documentés et non réutilisables.
Pratiques de stockage dispersées, volatiles sans garantie de pérennité (disque dur, clé USB, cloud etc.).
Absence de solution pour stocker et ouvrir de manière pérenne des données collectées lors d’un projet de recherche.
Source : Recherche Data Gouv
Les données de la recherche
5. Le cycle de vie de la donnée
Une bonne gestion des données est utile pour soi et pour les autres.Anticipée et planifiée dès le début de la recherche, elle permet de retrouver facilement ses données, de les rendre accessibles et réutilisables par d’autres. À l’issue d'un projet de recherche, elle facilite l’archivage et la diffusion des jeux de données.
Collecte
Mise en accès
Description
Archivage
Stockage
Source : Passeport pour la science ouverte
Traitement et analyse
Ce schéma provient de la 1ère édition du "Passeport pour la science" parue en juillet 2020.
Les données de la recherche
6. Les Principes FAIR
"Ensemble de principes directeurs pour gérer les données de la recherche."
Requiert une description et une indexation des données et métadonnées
Facile à trouver
Faciliter leur accès et/ou téléchargement en spécifiant les conditions d'accès
Accessible
Téléchargeable, utilisable, intelligible et combinable avec d'autres données, par des humains et des machines
Interopérable
Met en avant les caractéristiques qui rendent les données réutilisables pour de futures recherches ou d'autres finalités
Réutilisable
+ info
Source : Ouvrir la science : principes FAIR
Les données de la recherche
7. UN OUTIL : Le plan de gestion des données
Exemple d'un PGD ou DMP
C'est un document synthétique qui aide à organiser et anticiper toutes les étapes du cycle de vie de la donnée. Il explique pour chaque jeu de données comment seront gérées les données d’un projet, depuis leur création ou collecte jusqu’à leur partage et leur archivage.
Aspect financier
Le DMP (Data Management Plan) ou PGD (Plan de gestion des données) est évolutif et peut être un livrable exigé par certains financeurs tels que l'ANR ou la Commission européenne.
Dès le début de votre thèse, une aide précieuse
en savoir +
Source : Science ouverte COUPERIN
Les données de la recherche
Et maintenant, à vous de jouer !
Testez vos connaissances sur les données de la recherche.
Commencer
Les données de la recherche
1/2
Comment s'appelle l'outil de gestion dédié aux données de la recherche ?
Le PGD
Le RGPD
Le PGCD
Les données de la recherche
Correct
Le PGD (ou plan de gestion des données) explique comment vont être gérées du début à la fin du projet et au-délà, les données produites ou collectées durant le projet de recherche ou de la thèse.
Continuer
Les données de la recherche
2/2
À quels principes doivent obéir les données de la recherche, principes résumés sous l’acronyme FAIR ?
Glisser les réponses correctes vers la colonne de droite
Réparable
Institutionnel
Accessible
Fiable
Interopérable
Informel
Facile à trouver
Rare
Agréable
Automatique
Réutilisable
International
Fondamental
ressources
solution
Les données de la recherche
Quelques ressources à consulter
terminer
Sensibilisation à la science ouverte
Parcours de la formation
VI. Vers les sciences citoyennes et participatives
IV. Les données de la recherche
II. Introduction
VIII. Conclusion
I. Préambule
V. Soutien à la bibliodiversité
VII. Évaluation par les pairs
III. Diffuser ses publications
continuer
Les données de la recherche
Faux !
Réessayez !
Nouvel essai
Le rapport de la Commission européenne Cost of not having FAIR research data paru en 2019 estime que le coût de la mauvaise gestion des données de la recherche se chiffre à 3 milliards d’euros pour la France, en raison des pertes de temps, de la non optimisation des coûts de stockage, des frais de licence, des problèmes de duplication de la recherche, du manque de fertilisation croisée. Pour lire le rapport : Cost of not having FAIR research data
La question des données est un sujet stratégique, qui a fait l’objet d’un rapport demandé par le Premier ministre au député Éric Bothorel, « Pour une politique publique de la donnée » paru en décembre 2020. Il rappelle fortement les enjeux autour des données scientifiques comme vecteurs de connaissance.Pour en savoir plus : "Rapport Bothorel : pour une nouvelle ère de la politique publique de la donnée".
La gestion des données et le cycle de vie des données de la recherche
Cette vidéo (5'09) vous permet de comprendre en quoi une bonne gestion des données est utile pour vous et pour la communauté scientifique. Vous découvrez quelles questions vous poser pour organiser au mieux les données de la recherche tout au long de leur cycle de vie et les bénéfices d’une telle gestion, notamment en matière de partage et de réutilisation des données. Ces enjeux sont illustrés par le témoignage d’Egon Heuson, chargé de recherche à Centrale Lille.
Pour la visionner :https://www.canal-u.tv/chaines/ouvrirlascience/la-gestion-des-donnees-et-le-cycle-de-vie-des-donnees-de-la-recherche
INRAE a construit un plan « Données pour la science » (2022-2024), afin de mieux utiliser et de partager les données scientifiques grâce au développement du numérique. Ce plan implique une transformation systémique des pratiques et mobilise l’ensemble de l’Institut, pour favoriser une science plus ouverte, interdisciplinaire et prédictive. Pour en savoir plus : "Exploiter et partager les données scientifiques, moteur de la recherche", interview de deux acteurs clés de cette évolution, Michaël Chelle, chargé de mission « numérique » auprès de Carole Caranta (directrice générale déléguée Science et Innovation) et Hadi Quesneville, administrateur des données, algorithmes et codes.
Voici les bonnes réponses
FAIR
Facile à trouver
Accessible
Interopérable
Réutilisable
(Findable, Accessible, Interoperable, Reusable)
Pour en savoir plus, aller sur la page dédiée du CCSD.
En quelques minutes, la chargée de mission de la cellule science ouverte du SCD d'Aix-marseille vous présente comment créer votre plan de gestion des données.
Jeux de données
Un jeu de données est un ensemble de données ayant une cohérence intellectuelle, qu’elle soit dans l’intention ou dans la forme. Collectées et/ou produites, les données qui le composent peuvent être de nature différente (textes, chiffres, images fixes ou animées, sons, etc.). Par exemple, une photographie d’un champ, une analyse de sa terre et un relevé hygrométrique de ce champ peuvent constituer un jeu de données cohérent intellectuellement, même s’il est composé d’objets hétérogènes.
Source : GTSO Données de Couperin
Ce qu'il faut retenir de la loi République numérique
Favoriser la circulation des données et du savoir (Titre I) (Source : Pour une république numérique ?)
Ouverture par défaut des données publiques et des données d’intérêt général :La loi crée l’obligation pour les organismes publics de communiquer gratuitement en ligne leurs bases de données, sous réserve d’anonymisation et de protection du secret industriel et commercial, qui pourront ainsi être exploitées et réutilisées facilement par un particulier. Certains acteurs privés (entreprises titulaires des marchés publics, bénéficiaires de subventions publiques…) seront également tenus de communiquer des données d’intérêt général qui pourront concerner l’exploitation des services publics de transports, les transactions immobilières, ou encore la gestion et le recyclage des déchets. Les données issues de travaux de recherche scientifique financées par la puissance publique pourront également être accessibles librement après une courte période.
Article L533-4 dans le Chapitre III du Code de la recherche : La valorisation des résultats de la recherche par les établissements et organismes de recherche : I.-Lorsqu'un écrit scientifique issu d'une activité de recherche financée au moins pour moitié par des dotations de l'Etat est publié, [...] son auteur dispose, même après avoir accordé des droits exclusifs à un éditeur, du droit de mettre à disposition gratuitement dans un format ouvert, par voie numérique, [...] la version finale de son manuscrit acceptée pour publication, dès lors que l'éditeur met lui-même celle-ci gratuitement à disposition par voie numérique ou, à défaut, à l'expiration d'un délai courant à compter de la date de la première publication. [...]Pour en savoir plus, consultez legifrance.
La gestion des données de la recherche à amU
Page dédiée à CEDRE, structure de service et de recherche transversale.
Page dédiée aux données de la recherche par la Cellule Science Ouverte du Service commun de la documentation (les BU).
Page Science ouverte du guide pratique à destination des unités de recherche d'Aix-Marseille Université.
À l’Université d’Aix-Marseille, le service commun de documentation (les bibliothèques universitaires) pilote le projet "données de recherche" par l’intermédiaire de sa cellule science ouverte. Un comité de pilotage associe les acteurs et services qui travaillent en appui aux chercheurs, tels que la direction et la valorisation de la recherche, la direction du système d’information, la cellule Europe… L’accompagnement des chercheurs et des doctorants passe par la mise en place de canaux de communication dédiés, la sensibilisation et la formation, et l’appui à la rédaction de plans de gestion des données. Si vous souhaitez en savoir plus : "La gestion des données à Aix-Marseille" Le site couperin de la science ouverte en France
Si vous souhaitez comprendre les obligations des financeurs en matière de gestion des données de recherche et connaître pour chaque financeur les exigences ou non en matière de plan de gestion de données, stockage et partage des données issues des projets qu’il finance, n'hésitez pas à consulter le lien ci-dessous : Les exigences des financeurs, Doranum