Want to make creations as awesome as this one?

Transcript

10:00

|Documentation|documentation

DATA CURATOR

10:00

Pour déverrouiller, complétez les mots manquants (en respectant les majuscules !) :

|Description|description

|éthiques|Ethiques

|conservation|Conservation

|Partage|partage

|Stockage|stockage

Plan de gestion de données

1.

Modèle

des données et collecte ou réutilisation de

données existantes

2.

et qualité des données

3.

et sauvegarde pendant le processus de recherche

4.

Exigences légales et

5.

6.

des données et

à long terme.

Responsabilités et ressources en matière de gestion des données.

Valider

DATA CURATOR

Voici les étapes du cycle de vie des données. Clique sur celle qui t'intéresse !

Planifier

Partager

Collecter

Archiver

Réutiliser

Traiter

DATA CURATOR

Voici les étapes du cycle de vie des données. Clique sur celle qui t'intéresse !

Partager

Planifier

Collecter

Archiver

Réutiliser

Traiter

IMPORT

Import des données

Données importées!

Nettoyer les données

Correcteur de noms de fichiers

éxpérience_Quantum Leap_aout2024_raw data_old_version.bin

ExpQuantumLeap_23feb2024_treated data(1)(2)(3).csv

20240201_Exp_Quantum_Leap_logs_de_voyage.txt

Bravo !

Erreur !

3

10 erreurs détectées !!!

Corriger

0

0

20240809_exp_QuantumLeap_RawData_v01.bin

20240124_exp_QuantumLeap_TreatedData_v03.csv

20240224_exp_QuantumLeap_TravelLogs.txt

Corriger les données

Noms de fichiers corrigés !

éxpérience_Quantum Leap_aout2024_raw data_old_version.bin

ExpQuantumLeap_23feb2024_treated data(1)(2)(3).csv

2422024_Exp_Quantum_Leap_logs_de_voyage.txt

Correcteur de données

Corriger

0

0

5

8 erreurs détectées !!!

Correcteur de données

75000

33

E

(°C)

100

10/10/2023 08:01:15

XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX

* Ecart contraint anachronique : cf dictionnaire de données

*

Données nettoyées !

Ajouter un fichier Readme pour aidez les chercheurs à comprendre et réutiliser vos données !

DATA CURATOR

Planifier

Retour au menu

Le plan de gestion des données (PGD ; DMP en anglais) est un outil de gestion de projet. Il se présente sous forme d’un document structuré en rubriques. Il a pour objectif de synthétiser la description et l’évolution des jeux de données de votre projet de recherche. Il prépare le partage, la réutilisation et la pérennisation des données.

DMP OPIDoR est un outil d’aide à la création en ligne de plans de gestion de données mis à disposition de l’Enseignement Supérieur et de la Recherche.

DATA CURATOR

Que voulez-vous savoir ?

Retour au menu

Collecter

Comment organiser mes dossiers ?

Comment nommer mes fichiers ?

Comment ajouter des métadonnées ?

Où dupliquer et stocker mes données ?

DATA CURATOR

Quels supports de stockage choisir ?

Retour au menu

Ordinateur

DDisque/clé externe

Serveur institutionnel

Serveur cloud privé

Collecter

DATA CURATOR

Pour un stockage temporaire ; nécessité de crypter ou sécuriser physiquement les données sensibles

Conseil

SECURITE

ACCES

COUT

BILAN

Règle du 3+2+1 contre la perte de données 3 exemplaires sur 2 supports différents dont au moins 1 copie hors site (hos du bureau ou de l'organisation)

Collecter

BACK

DATA CURATOR

Pour un stockage temporaire ; nécessité de crypter les données sensibles

BILAN

SECURITE

ACCES

COUT

Conseil

Règle du 3+2+1 contre la perte de données 3 exemplaires sur 2 supports différents dont au moins 1 copie hors site (hors du bureau ou de l'organisation)

Collecter

BACK

DATA CURATOR

SECURITE

ACCES

COUT

Pour un stockage plus pérenne ; Adapté pour le stockage de données sensibles et des versions "stables" de vos données

BILAN

SECURITE

ACCES

COUT

Conseil

Règle du 3+2+1 contre la perte de données 3 exemplaires sur 2 supports différents dont au moins 1 copie hors site (hors du bureau ou de l'organisation)

BACK

Collecter

DATA CURATOR

Ne pas y mettre de données sensibles ; pas de contrôle sur la procédure de sauvegarde, le lieu de stockage et le devenir des données

BILAN

Règle du 3+2+1 contre la perte de données 3 exemplaires sur 2 supports différents dont au moins 1 copie hors site (hors du bureau ou de l'organisation)

SECURITE

ACCES

COUT

Conseil

Collecter

BACK

DATA CURATOR

BACK

Vous voulez des conseils sur :

Organisation des dossiers

Nommage des fichiers

Collecter

DATA CURATOR

Pas de règle absolue pour l'organisation des dossiers, mais l'objectif est d'éviter la perte de données, tout en optimisant leur réutilisation, par vous-même ou un autre chercheur. Il faut donc :

  • Trouver l'équilibre dans la profondeur de l'arborescence.

  • Organiser les dossiers et sous-dossiers de façon logique : par projet, expérience, date, type de données (brutes vs analysées)...

VOIR UN EXEMPLE D'ARBORESCENCE

  • Mettre un fichier Readme.txt dans chaque dossier pour expliquer le type de données qui s'y trouve.

Collecter

BACK

DATA CURATOR

Collecter

BACK

DATA CURATOR

5 règles pour bien nommer ses fichiers :

Donner un nom bref et explicite

Ne pas mettre d'espace ni de caractères spéciaux

Indiquer les dates au formatAAAA-MM-JJ

Placer l'élément important en premier

Indiquer les versions des fichiers

Collecter

BACK

DATA CURATOR

Retour au menu

Traiter

Avant de traiter et d'analyser vos données, assurez-vous qu'elles soient "propres".Pour cela, rien de tel qu'un petit nettoyage !

DATA CURATOR

Retour au menu

Traiter

Vérifier l'orthographe et les fautes de frappe

Supprimer les doublons

Harmoniser le vocabulaire, l'utilisation des MAJ/min, le formatage des dates

Attention aux espaces et caractères invisibles

Evitez les abbréviations non explicitées

6 règles pour bien nettoyer ses données :

Précisez les unités de mesure

DATA CURATOR

Collecter

La description des données doit être suffisante pour assurer leur validation, reproductibilité et réutilisation : titre explicite, date description, technologie, organisme, mots clés, etc.

Il est recommandé d'utiliser des standards de métadonnées (liste de champs descriptifs des données) lorsqu'ils existent dans votre discipline. Il existe également des standards généralistes comme le Dublin Core.

Les données doivent aussi être accompagnées d'une documentation permettant leur réutilisation. Par exemple :

  • Un document (fichier Readme par exemple) expliquant le contexte, la méthodologie, les outils / logiciels utilisés peut être utilisé
  • Un dictionnaire de données permettant d'expliciter les vairables mesurées (entêtes des colonnes, unités utilisées, acronymes...)

Exemple de fichier Readme.txt

BACK

4. CONTENU----------------------------------------------------------------------------------------------------------------------------Liste des fichiers[NomFichier_1] : [NomFichier_2] : [NomFichier_3] : [Archive Zip 1] : [Description des fichiers contenus dans le dossier Zip, par exemple Imageset1]Informations complémentairesOrganisation des fichiers :Formats et structure des fichiers: Versions : Logiciel requis (en majuscules - préciser sa version) :----------------------------------------------------------------------------------------------------------------------------5. METHODE et TRAITEMENT----------------------------------------------------------------------------------------------------------------------------Cette section doit décrire la manière dont le contenu du jeu de données a été généré : l'équipement, le matériel/ les logiciels (préciser la version), les algorithmes, les formules, les procédures expérimentales/les protocoles, comment les données ont été modifiées ou traitées (par exemple, normalisées), etc.Si ces informations sont disponibles dans un document séparé, elles doivent être référencées ou stockées conjointement avec les données au format PDF.Les publications associées peuvent être référencées à partir de l'enregistrement des métadonnées du jeu de données.----------------------------------------------------------------------------------------------------------------------------6. INFORMATIONS ASSOCIEES------------------------------------------------------------------------------------------------------------------------------[Identifier les informations contextuelles, les métadonnées et toute autre informationnécessaire à l'utilisateur pour interpréter pleinement, comprendre et utiliser ce jeu de données ; savoir où et comment accéder aux données.]

0. SOMMAIRE------------------------------------------------------------------------------------------------------------------------------1. Projet2. Jeux de données3. Conditions d'utilisation 4. Contenu5. Méthode et traitement6. Informations associées => Données associées----------------------------------------------------------------------------------------------------------------------------1. PROJET----------------------------------------------------------------------------------------------------------------------------Titre (en majuscules) : Dates : [Début/fin du projet]Organisme financeur : Numéro de subvention :----------------------------------------------------------------------------------------------------------------------------2. JEUX DE DONNEES----------------------------------------------------------------------------------------------------------------------------Titre :Description : [Résumé ou brève description du jeu de données]Année de publication :Créateur(s)Prénomo NOM: Organisme(s) : Sources (si applicable): [Citations de données provenant d'autres sources] ----------------------------------------------------------------------------------------------------------------------------3. CONDITIONS D'UTILISATION----------------------------------------------------------------------------------------------------------------------------[Cette section doit fournir des informations sur les droits de propriété intellectuelle, les droits statutaires, les licences et les conditions d'utilisation/restrictions.]

README

BACK

4. CONTENU----------------------------------------------------------------------------------------------------------------------------Liste des fichiers[NomFichier_1] : [NomFichier_2] : [NomFichier_3] : [Archive Zip 1] : [Description des fichiers contenus dans le dossier Zip, par exemple Imageset1]Informations complémentairesOrganisation des fichiers :Formats et structure des fichiers: Versions : Logiciel requis (en majuscules - préciser sa version) :----------------------------------------------------------------------------------------------------------------------------5. METHODE et TRAITEMENT----------------------------------------------------------------------------------------------------------------------------Calibrage du banc d'essai :Flux magnétique :Fréquence des ondes électromagnétiques :Puissance électrique :Durée de la charge :----------------------------------------------------------------------------------------------------------------------------6. INFORMATIONS ASSOCIEES------------------------------------------------------------------------------------------------------------------------------[Identifier les informations contextuelles, les métadonnées et toute autre informationnécessaire à l'utilisateur pour interpréter pleinement, comprendre et utiliser ce jeu de données ; savoir où et comment accéder aux données.]

0. SOMMAIRE------------------------------------------------------------------------------------------------------------------------------1. Projet2. Jeux de données3. Conditions d'utilisation 4. Contenu5. Méthode et traitement6. Informations associées => Données associées----------------------------------------------------------------------------------------------------------------------------1. PROJET----------------------------------------------------------------------------------------------------------------------------Titre (en majuscules) : Dates : [Début/fin du projet]Organisme financeur : Numéro de subvention :----------------------------------------------------------------------------------------------------------------------------2. JEUX DE DONNEES----------------------------------------------------------------------------------------------------------------------------Titre :Description : [Résumé ou brève description du jeu de données]Année de publication :Créateur(s)Prénomo NOM: Organisme(s) : Sources (si applicable): [Citations de données provenant d'autres sources] ----------------------------------------------------------------------------------------------------------------------------3. CONDITIONS D'UTILISATION----------------------------------------------------------------------------------------------------------------------------[Cette section doit fournir des informations sur les droits de propriété intellectuelle, les droits statutaires, les licences et les conditions d'utilisation/restrictions.]

CONFIDENTIEL

/

NON PUBLIE

RAS

RAS

RAS

20240809_exp_QuantumLeap_RawData_v01.bin

20240124_exp_QuantuLeap_TreatedData_v03.csv

20180608

20240224_exp_QuantumLeap_TravelLogs.txt

README

90 T

145 s

9 GW

80 THz

DARKO

145 s

DARKOWARE 2.0

9 GW

80 THz

DARKO

90 T

Archibald SNOW

Archibald SNOW

Retour au menu

DarkoWare 2.0

METADONNEES OK

DATA CURATOR

Firewall détecté. Code de désactivation ?

Retour au menu

Es-tu prêt à partager tes données ?

OUI

NON

DATA CURATOR

Grâce à son partenariat avec le Ministère de l'enseignemen supérieur, DATA CURATOR te permet de déposer tes jeux de données sur l'entrepôt recherche.data.gouv (ou un autre) en quelques clics !Il te suffit pour cela de répondre à quelques questions pour vérifier que tu as le droit de partager ces données et qu'elles pourront facilement être réutilisées par d'autres chercheurs.

Diffuser tes données

DATA CURATOR

Grâce à son partenriat avec le Ministère de l'enseignemen supérieur, DATA CURATOR te permet de déposer tes jeux de données sur l'entrepôt recherche.data.gouv en quelques clics !Il te suffit opur cla de répondre à quelques questions pour vérifier que tu as le droit de partager ces données et qu'elles pourront facilement être réutilisées par d'autres chercheurs.

Retour au menu

Diffusion

Données

des

Diffuser tes données

Start >

Diffusion

Données

Start >

des

partager ses données : oui, mais...

– As-tu le droit de diffuser ces données ?

– Tes données sont-elles suffisamment bien organisées et documentées pour être compréhensibles ?

- Tes données sont-elles dans des formats ouverts ou largement partagés par ta communauté scientifique ?

– Tes données sont-elles accompagnées d'un identifiant pérenne et d'une licence de réutilisation ?

format propriétaire

Quelques vérifications s'imposent !

Propriété des données

Droits de diffusion

Réutilisabilité

1

2

4

3

choix de l'entrepôt et de la licence

Les données ont-elles été produites dans le cadre d'un partenariat industriel ?

OUI

NON

Retour

Diffusion possible sous conditions :se référer a l'accord de consortium ou au contrat entre partenaires

|alternative1|alternative2

N° du contrat :

Contrat identifié !

Retour

N° INCONNU !

Qui est titulaire des droits sur les données ?

Moi

Partage de propriété

Mon institution

Retour

|alternative1|alternative2

Diffusion possible sous réserve d'une règlementation ou d'un droit particulier

Code-barre de la preuve :

N° INCONNU !

Retour

|alternative1|alternative2

Diffusion possible avec l'accord des ayant-droits et sous réserve d'une règlementation ou d'un droit particulier

Absence de donnéesa cractère personnel confirmée !

Code-barre de la preuve :

N° INCONNU !

Retour

ECHEC du partage!

L'accord de consortium n'autorise pas le partage des données

Modifier les termes de l'accord ?

Piratage data curator en cours...

Pour modifier les termes de l'accord, prouvez que vous n'êtes pas un robot en résolvant le mini-jeu ci-dessous

Data curator

L'accord de consortium a été modifié et autorise le partage des données

bravo!

Votre institution est propriétaire des données et accepte de les partager

bravo!

1ere etape VALIDEE pour le partage !

format propriétaire

Quelques vérifications s'imposent !

Propriété des données

1

2

4

3

interdictions et obligations de diffusion

choix de l'entrepôt et de la licence

Réutilisabilité

Vos données contiennent-elles des données à caractère personnel ?

OUI

NON

Retour

|alternative1|alternative2

Vos données ne contiennent pas de données à caractère personnel

Code-barre de la preuve :

N° INCONNU !

Retour

Avez-vous anonymisé ou pseudonymisé ces données ?

OUI

NON

Retour

Vos données sont-elles protégées ou protégeables par un des droit suivants :

OUI

NON

  • Données relatives à la sécurité, à la défense ou au secteur scientifique protégé
  • Données soumises au secret professionnel
  • Données relatives au secret des affaires
  • Données protégées par le droit d'auteur
  • Données relatives à une invention brevetable ou valorisable
  • Base de données ou logicel

Retour

ECHEC du partage!

Interdiction de diffuser les données sans l'accord expresse des personnes concernées

ECHEC du partage!

L'analyse des données né décèle aucun processus d'anonymisation

ECHEC du partage!

L'analyse des données montre qu'elles sont soumises au secret défense

Pirater le système

Piratage data curator en cours...

ECHEC du partage!

Vos données ne peuvent être diffusées en l'état

Pirater le système

Piratage data curator en cours...

Pour pirater le système, prouvez que vous n'êtes pas un robot en résolvant le mini-jeu ci-dessous

Vos données ne sont pas soumises à un droit en interdisant ou en restreignant l'ouverture

bravo!

format propriétaire

Quelques vérifications s'imposent !

Propriété des données

Réutilisabilité

choix de l'entrepôt et de la licence

interdictions et obligations de diffusion

1

2

4

3

Vos données sont-elles correctement organisées et décrites ?

Retour

Fichiers correctement nommés ?

Données correctement décrites ?

Données nettoyées et exploitables ?

Vos données sont-elles dans des formats ouverts ?

OUI

NON

Retour

ECHEC du partage!

Vos données sont dans des formats propriétaires, ce qui limitera leur réutilisation

VALIDER

Prouvez-le en montrant que vuos savez ce qu'est un format ouvert : cochez ci-dessous les formats ouverts puis validez

Réinitialiser

Retour

format propriétaire

Quelques vérifications s'imposent !

Propriété des données

choix de l'entrepôt et de la licence

Réutilisabilité

interdictions et obligations de diffusion

1

2

4

3

Sous quelle licence souhaitez-vous partager vos données ?

|Etalab|etalab|Licence ouverte|licence ouverte|Open licence|open licence|Creative Commons|creative commons|Creative commons|CC|CC-BY|Licences CC|cc|cc by|CC BY|cc-by

|Apache|apache|BSD|CeCILL|GNU|MIT|cecill|mit|gnu|bsd

AU MOINS UNE REPONSE FAUSSE !

Pour le logiciel Darkoware 2.0 :

Licences validées !

Pour les données :

|Recherche data gouv|recherche data gouv|Recherche.data.gouv|recherche.data.gouv

ENTREPÔT INCONNU !

Nom de l'entrepôt :

Entrepôt validé !

Sous quelle licence souhaitez-vous partager vos données ?

format propriétaire

Quelques vérifications s'imposent !

choix de l'entrepôt et de la licence

Propriété des données

interdictions et obligations de diffusion

Réutilisabilité

Données diffusées

1

2

4

3

Toutes les vérifications ont été faites !