Want to make creations as awesome as this one?

Transcript

10:00

|Documentation

DATA CURATOR

Pour déverrouiller, complétez les mots manquants (en respectant les majuscules !) :

|Description

|éthiques

|conservation

|Partage

|Stockage

Plan de gestion de données

1.

Modèle

des données et collecte ou réutilisation de

données existantes

2.

et qualité des données

3.

et sauvegarde pendant le processus de recherche

4.

Exigences légales et

5.

6.

des données et

à long terme.

Responsabilités et ressources en matière de gestion des données.

Valider

DATA CURATOR

Voici les étapes du cycle de vie des données. Clique sur celle qui t'intéresse !

Planifier

Partager

Collecter

Archiver

Réutiliser

Traiter

DATA CURATOR

Voici les étapes du cycle de vie des données. Clique sur celle qui t'intéresse !

Partager

Planifier

Collecter

Archiver

Réutiliser

Traiter

DATA CURATOR

Planifier

Retour au menu

Le plan de gestion des données (PGD ; DMP en anglais) est un outil de gestion de projet. Il se présente sous forme d’un document structuré en rubriques. Il a pour objectif de synthétiser la description et l’évolution des jeux de données de votre projet de recherche. Il prépare le partage, la réutilisation et la pérennisation des données.

DMP OPIDoR est un outil d’aide à la création en ligne de plans de gestion de données mis à disposition de l’Enseignement Supérieur et de la Recherche.

DATA CURATOR

Créer de nouvelles donnéesRécupérer et retravailler des données existantes

Allez-vous :

Retour au menu

StockageSauvegarde

DATA CURATOR

Que voulez-vous savoir ?

Retour au menu

Collecter

Comment organiser mes dossiers ?

Comment nommer mes fichiers ?

Comment ajouter des métadonnées ?

Où dupliquer et stocker mes données ?

DATA CURATOR

Quels supports de stockage choisir ?

Retour au menu

Ordinateur

DDisque/clé externe

Serveur institutionnel

Serveur cloud privé

Collecter

DATA CURATOR

Pour un stockage temporaire ; nécessité de crypter ou sécuriser physiquement les données sensibles

Conseil

SECURITE

ACCES

COUT

BILAN

Règle du 3+2+1 contre la perte de données 3 exemplaires sur 2 supports différents dont au moins 1 copie hors site (hos du bureau ou de l'organisation)

Collecter

BACK

DATA CURATOR

Pour un stockage temporaire ; nécessité de crypter les données sensibles

BILAN

SECURITE

ACCES

COUT

Conseil

Règle du 3+2+1 contre la perte de données 3 exemplaires sur 2 supports différents dont au moins 1 copie hors site (hors du bureau ou de l'organisation)

Collecter

BACK

DATA CURATOR

SECURITE

ACCES

COUT

Pour un stockage plus pérenne ; Adapté pour le stockage de données sensibles et des versions "stables" de vos données

BILAN

SECURITE

ACCES

COUT

Conseil

Règle du 3+2+1 contre la perte de données 3 exemplaires sur 2 supports différents dont au moins 1 copie hors site (hors du bureau ou de l'organisation)

BACK

Collecter

DATA CURATOR

Ne pas y mettre de données sensibles ; pas de contrôle sur la procédure de sauvegarde, le lieu de stockage et le devenir des données

BILAN

Règle du 3+2+1 contre la perte de données 3 exemplaires sur 2 supports différents dont au moins 1 copie hors site (hors du bureau ou de l'organisation)

SECURITE

ACCES

COUT

Conseil

Collecter

BACK

DATA CURATOR

Retour au menu

Vous voulez des conseils sur :

Organisation des dossiers

Nommage des fichiers

Collecter

DATA CURATOR

Pas de règle absolue pour l'organisation des dossiers, mais l'objectif est d'éviter la perte de données, tout en optimisant leur réutilisation, par vous-même ou un autre chercheur. Il faut donc :

  • Trouver l'équilibre dans la profondeur de l'arborescence.

  • Organiser les dossiers et sous-dossiers de façon logique : par projet, expérience, date, type de données (brutes vs analysées)...

VOIR UN EXEMPLE D'ARBORESCENCE

  • Mettre un fichier Readme.txt dans chaque dossier pour expliquer le type de données qui s'y trouve.

Collecter

BACK

DATA CURATOR

Collecter

BACK

DATA CURATOR

5 règles pour bien nommer ses fichiers :

Donner un nom bref et explicite

Ne pas mettre d'espace ni de caractères spéciaux

Indiquer les dates au formatAAAA-MM-JJ

Placer l'élément important en premier

Indiquer les versions des fichiers

Collecter

BACK

DATA CURATOR

Retour au menu

Traiter

Avant de traiter et d'analyser ses données, assurez-vous qu'elles soient "propres".Pour cela, rien de tel qu'un petit nettoyage !

DATA CURATOR

Retour au menu

Traiter

Vérifier l'orthographe et les fautes de frappe

Supprimer les doublons

Harmoniser le vocabulaire, l'utilisation des MAJ/min, le formatage des dates

Attention aux espaces et caractères invisibles

Evitez les abbréviations non explicitées

6 règles pour bien nettoyer ses données :

Précisez les unités de mesure

DATA CURATOR

Retour au menu

Collecter

La description des données doit être suffisante pour assurer leur validation, reproductibilité et réutilisation : titre explicite, date description, technologie, organisme, mots clés, etc.

Il est recommandé d'utiliser des standards de métadonnées (liste de champs descriptifs des données) lorsqu'ils existent dans votre discipline. Il existe également des standards généralistes comme le Dublin Core.

Les données doivent aussi être accompagnées d'une documentation permettant leur réutilisation. Par exemple :

  • Un document (fichier Readme par exemple) expliquant le contexte, la méthodologie, les outils / logiciels utilisés peut être utilisé
  • Un dictionnaire de données permettant d'expliciter les vairables mesurées (entêtes des colonnes, unités utilisées, acronymes...)

Exemple de fichier Readme.txt

4. CONTENU----------------------------------------------------------------------------------------------------------------------------Liste des fichiers[NomFichier_1] : [NomFichier_2] : [NomFichier_3] : [Archive Zip 1] : [Description des fichiers contenus dans le dossier Zip, par exemple Imageset1]Informations complémentairesOrganisation des fichiers :Formats et structure des fichiers: Versions : Logiciel requis (en majuscules - préciser sa version) :----------------------------------------------------------------------------------------------------------------------------5. METHODE et TRAITEMENT----------------------------------------------------------------------------------------------------------------------------Calibrage du banc d'essai :Flux magnétique :Fréquence des ondes électromagnétiques :Puissance électrique :Durée de la charge :----------------------------------------------------------------------------------------------------------------------------6. INFORMATIONS ASSOCIEES------------------------------------------------------------------------------------------------------------------------------[Identifier les informations contextuelles, les métadonnées et toute autre informationnécessaire à l'utilisateur pour interpréter pleinement, comprendre et utiliser ce jeu de données ; savoir où et comment accéder aux données.]

0. SOMMAIRE------------------------------------------------------------------------------------------------------------------------------1. Projet2. Jeux de données3. Conditions d'utilisation 4. Contenu5. Méthode et traitement6. Informations associées => Données associées----------------------------------------------------------------------------------------------------------------------------1. PROJET----------------------------------------------------------------------------------------------------------------------------Titre (en majuscules) : Dates : [Début/fin du projet]Organisme financeur : Numéro de subvention :----------------------------------------------------------------------------------------------------------------------------2. JEUX DE DONNEES----------------------------------------------------------------------------------------------------------------------------Titre :Description : [Résumé ou brève description du jeu de données]Année de publication :Créateur(s)Prénomo NOM: Organisme(s) : Sources (si applicable): [Citations de données provenant d'autres sources] ----------------------------------------------------------------------------------------------------------------------------3. CONDITIONS D'UTILISATION----------------------------------------------------------------------------------------------------------------------------[Cette section doit fournir des informations sur les droits de propriété intellectuelle, les droits statutaires, les licences et les conditions d'utilisation/restrictions.]

CONFIDENTIEL

/

NON PUBLIE

RAS

RAS

RAS

20240809_exp_QuantumLeap_RawData_v01.bin

20240124_exp_QuantuLeap_TreatedData_v03.csv

20180608

20240224_exp_QuantumLeap_TravelLogs.txt

README

90 T

145 s

9 GW

80 THz

DARKO

145 s

DARKOWARE 2.0

9 GW

80 THz

DARKO

90 T

Archibald SNOW

Archibald SNOW

Retour au menu

DarkoWare 2.0

METADONNEES OK

DATA CURATOR

Firewall détecté. Code de désactivation ?

Retour au menu

DATA CURATOR

Voici les étapes du cycle de vie des données. Clique sur celle qui t'intéresse !

Partager

Planifier

Collecter

Archiver

Réutiliser

Traiter

IMPORT

Es-tu prêt à partager tes données ?

OUI

NON

DATA CURATOR

Grâce à son partenriat avec le Ministère de l'enseignemen supérieur, DATA CURATOR te permet de déposer tes jeux de données sur l'entrepôt recherche.data.gouv en quelques clics !Il te suffit opur cla de répondre à quelques questions pour vérifier que tu as le droit de partager ces données et qu'elles pourront facilement être réutilisées par d'autres chercheurs.

Diffuser tes données

OUI

Les principes juridiques et éthiques sont-ils respectés ?

NON

Vous devez être particulièrement vigilant sur les données à caractère personnel, c’est-à-dire les informations qui permettent d’identifier directement ou indirectement une personne physique (nom, prénom, numéro de téléphone, de sécurité sociale, etc.).Dans ce cas, référez-vous à la CNIL ou au DPD (Délégué à la Protection des données) de votre organisme.

Vos données contiennent-elles des informations à caractère personnel ?

N° de l'élément de preuve :

OUI

As-tu vérifié ou obtenu les droits de diffusion des données ?

NON

Les données ne sont pas considérées comme des oeuvres de l'esprit ; le droit d'auteur ne s'applique pas (sauf dans le cas des bases de données).La propriété des données appartient au producteur des données, c'est-à-dire la personne physique ou morale ayant financé les coûts de production des données.

Etes-vous propriétaire des données ou avez-vous l'accord du propriétaire des donnes pour les diffuser ?

N° de l'élément de preuve :

Les données financées au moins à moitié par des fonds publics sont considérées comme des documents administratifs et doivent être par défaut ouvertes. Certaines données peuvent cependant faire l’objet d’une interdiction de diffusion (sécurité publique, secret défense, secrets professionnels...)

As-tu défini les modalités d'accès aux données ?

OUI

NON

Suivant l’entrepôt, il vous sera possible de choisir un accès ouvert ou un accès restreint (à une communauté scientifique par exemple). Vous pourrez également déposer vos données mais les rendre accessibles plus tard en décidant d’un embargo.

Souhaitez-vous que les données soient immédiatement accessibles ?

N° de l'élément de preuve :

Les fichiers sont-ils nommés et organisés de manière explicite ?

OUI

NON

Vos données doivent être organisées correctement pour un traitement informatique ou une intégration dans une base de données.Nommez de façon claire et cohérente vos dossiers et fichiers. Les dénominations doivent avoir du sens et refléter le contenu. Vous pouvez suivre quelques règles pour éviter toute confusion, suppression accidentelle ou problème d’affichage (pas de caractères spéciaux, pas d’accents, pas d’espaces, pas de mots vides, etc.). Créez votre propre convention de nommage pour qu’elle convienne à votre contexte et à vos collaborateurs.

Vos fichiers sont-ils nommés et organisés de manière explicite ?

N° de l'élément de preuve :

Les fichiers sont-ils dans des formats ouverts et pérennes ?

OUI

NON

Vous devez utiliser des formats de fichiers acceptés par l’entrepôt choisi. Dans tous les cas, il est préférable d’éviter les formats fermés et de privilégier les formats ouverts ou largement répandus, afin que vos données puissent être lues et réutilisées. Convertissez le format de vos fichiers si besoin, par exemple un format XLS (format Excel fermé) vers un format CSV (format ouvert).

Vos fichiers sont-ils dans des formats ouverts et pérennes ?

N° de l'élément de preuve :

OUI

Les données sont-elles décrites et documentées ?

La description des données doit être suffisante pour assurer leur validation, reproductibilité, réutilisation. Vos données doivent donc être bien décrites : titre explicite, description, technologie, organisme, mots clés, etc.

NON

Il est également nécessaire de fournir la documentation qui permet la réutilisation de vos données : par exemple, un fichier Readme) expliquant le contexte, la méthodologie, les outils/logiciels utilisés et toutes les informations indispensables à la réutilisation de vos données.Un dictionnaire de données permettant d’expliciter les variables mesurées peut également être fourni séparément. Par exemple, pour un fichier tabulé, il peut être nécessaire de spécifier les entêtes des colonnes, les unités utilisées, les acronymes, etc.

Vos données sont-elles correctement décrites et documentées ?

N° de l'élément de preuve :

OUI

Un identifiant unique pérenne est-il attribué aux données ?

L’entrepôt attribue généralement un identifiant pérenne ou un accession number. Recherche data gouv attribue par exemple un DOI pour chaque jeu de données déposé.Pour les codes sources, il est recommandé de les déposer dans l’archive universelle Software Heritage qui attribue un identifiant SWHID.

NON

Vos données disposent-elles ou disposeront-elles d'un identifiant unique pérenne ?

N° de l'élément de preuve :

Une licence appropriée est-elle attribuée aux données ?

Une licence de diffusion est indispensable pour définir les conditions de réutilisation des données. Pour favoriser le partage, il est souhaitable de choisir une licence la plus ouverte possible, permettant une utilisation libre et sans restriction. L’entrepôt peut vous proposer plusieurs licences au choix. Une licence précise peut également vous être imposée.

Quelle licence souhaitez-vous attribuer à votre jeu de données ?

Données ouvertes.