dataCurator
bibliotheque
Created on October 26, 2023
More creations to inspire you
LET’S GO TO LONDON!
Personalized
SLYCE DECK
Personalized
ENERGY KEY ACHIEVEMENTS
Personalized
CULTURAL HERITAGE AND ART KEY ACHIEVEMENTS
Personalized
ABOUT THE EEA GRANTS AND NORWAY
Personalized
DOWNFALLL OF ARAB RULE IN AL-ANDALUS
Personalized
HUMAN AND SOCIAL DEVELOPMENT KEY
Personalized
Transcript
10:00
|Documentation|documentation
DATA CURATOR
10:00
Pour déverrouiller, complétez les mots manquants (en respectant les majuscules !) :
|Description|description
|éthiques|Ethiques
|conservation|Conservation
|Partage|partage
|Stockage|stockage
Plan de gestion de données
1.
Modèle
des données et collecte ou réutilisation de
données existantes
2.
et qualité des données
3.
et sauvegarde pendant le processus de recherche
4.
Exigences légales et
5.
6.
des données et
à long terme.
Responsabilités et ressources en matière de gestion des données.
Valider
DATA CURATOR
Voici les étapes du cycle de vie des données. Clique sur celle qui t'intéresse !
Planifier
Partager
Collecter
Archiver
Réutiliser
Traiter
DATA CURATOR
Voici les étapes du cycle de vie des données. Clique sur celle qui t'intéresse !
Partager
Planifier
Collecter
Archiver
Réutiliser
Traiter
IMPORT
Import des données
Données importées!
Nettoyer les données
Correcteur de noms de fichiers
éxpérience_Quantum Leap_aout2024_raw data_old_version.bin
ExpQuantumLeap_23feb2024_treated data(1)(2)(3).csv
20240201_Exp_Quantum_Leap_logs_de_voyage.txt
Bravo !
Erreur !
3
10 erreurs détectées !!!
Corriger
0
0
20240809_exp_QuantumLeap_RawData_v01.bin
20240124_exp_QuantumLeap_TreatedData_v03.csv
20240224_exp_QuantumLeap_TravelLogs.txt
Corriger les données
Noms de fichiers corrigés !
éxpérience_Quantum Leap_aout2024_raw data_old_version.bin
ExpQuantumLeap_23feb2024_treated data(1)(2)(3).csv
2422024_Exp_Quantum_Leap_logs_de_voyage.txt
Correcteur de données
Corriger
0
0
5
8 erreurs détectées !!!
Correcteur de données
75000
33
E
(°C)
100
10/10/2023 08:01:15
XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX
* Ecart contraint anachronique : cf dictionnaire de données
*
Données nettoyées !
Ajouter un fichier Readme pour aidez les chercheurs à comprendre et réutiliser vos données !
DATA CURATOR
Planifier
Retour au menu
Le plan de gestion des données (PGD ; DMP en anglais) est un outil de gestion de projet. Il se présente sous forme d’un document structuré en rubriques. Il a pour objectif de synthétiser la description et l’évolution des jeux de données de votre projet de recherche. Il prépare le partage, la réutilisation et la pérennisation des données.
DMP OPIDoR est un outil d’aide à la création en ligne de plans de gestion de données mis à disposition de l’Enseignement Supérieur et de la Recherche.
DATA CURATOR
Que voulez-vous savoir ?
Retour au menu
Collecter
Comment organiser mes dossiers ?
Comment nommer mes fichiers ?
Comment ajouter des métadonnées ?
Où dupliquer et stocker mes données ?
DATA CURATOR
Quels supports de stockage choisir ?
Retour au menu
Ordinateur
DDisque/clé externe
Serveur institutionnel
Serveur cloud privé
Collecter
DATA CURATOR
Pour un stockage temporaire ; nécessité de crypter ou sécuriser physiquement les données sensibles
Conseil
SECURITE
ACCES
COUT
BILAN
Règle du 3+2+1 contre la perte de données 3 exemplaires sur 2 supports différents dont au moins 1 copie hors site (hos du bureau ou de l'organisation)
Collecter
BACK
DATA CURATOR
Pour un stockage temporaire ; nécessité de crypter les données sensibles
BILAN
SECURITE
ACCES
COUT
Conseil
Règle du 3+2+1 contre la perte de données 3 exemplaires sur 2 supports différents dont au moins 1 copie hors site (hors du bureau ou de l'organisation)
Collecter
BACK
DATA CURATOR
SECURITE
ACCES
COUT
Pour un stockage plus pérenne ; Adapté pour le stockage de données sensibles et des versions "stables" de vos données
BILAN
SECURITE
ACCES
COUT
Conseil
Règle du 3+2+1 contre la perte de données 3 exemplaires sur 2 supports différents dont au moins 1 copie hors site (hors du bureau ou de l'organisation)
BACK
Collecter
DATA CURATOR
Ne pas y mettre de données sensibles ; pas de contrôle sur la procédure de sauvegarde, le lieu de stockage et le devenir des données
BILAN
Règle du 3+2+1 contre la perte de données 3 exemplaires sur 2 supports différents dont au moins 1 copie hors site (hors du bureau ou de l'organisation)
SECURITE
ACCES
COUT
Conseil
Collecter
BACK
DATA CURATOR
BACK
Vous voulez des conseils sur :
Organisation des dossiers
Nommage des fichiers
Collecter
DATA CURATOR
Pas de règle absolue pour l'organisation des dossiers, mais l'objectif est d'éviter la perte de données, tout en optimisant leur réutilisation, par vous-même ou un autre chercheur. Il faut donc :
- Trouver l'équilibre dans la profondeur de l'arborescence.
- Organiser les dossiers et sous-dossiers de façon logique : par projet, expérience, date, type de données (brutes vs analysées)...
VOIR UN EXEMPLE D'ARBORESCENCE
- Mettre un fichier Readme.txt dans chaque dossier pour expliquer le type de données qui s'y trouve.
Collecter
BACK
DATA CURATOR
Collecter
BACK
DATA CURATOR
5 règles pour bien nommer ses fichiers :
Donner un nom bref et explicite
Ne pas mettre d'espace ni de caractères spéciaux
Indiquer les dates au formatAAAA-MM-JJ
Placer l'élément important en premier
Indiquer les versions des fichiers
Collecter
BACK
DATA CURATOR
Retour au menu
Traiter
Avant de traiter et d'analyser vos données, assurez-vous qu'elles soient "propres".Pour cela, rien de tel qu'un petit nettoyage !
DATA CURATOR
Retour au menu
Traiter
Vérifier l'orthographe et les fautes de frappe
Supprimer les doublons
Harmoniser le vocabulaire, l'utilisation des MAJ/min, le formatage des dates
Attention aux espaces et caractères invisibles
Evitez les abbréviations non explicitées
6 règles pour bien nettoyer ses données :
Précisez les unités de mesure
DATA CURATOR
Collecter
La description des données doit être suffisante pour assurer leur validation, reproductibilité et réutilisation : titre explicite, date description, technologie, organisme, mots clés, etc.
Il est recommandé d'utiliser des standards de métadonnées (liste de champs descriptifs des données) lorsqu'ils existent dans votre discipline. Il existe également des standards généralistes comme le Dublin Core.
Les données doivent aussi être accompagnées d'une documentation permettant leur réutilisation. Par exemple :
- Un document (fichier Readme par exemple) expliquant le contexte, la méthodologie, les outils / logiciels utilisés peut être utilisé
- Un dictionnaire de données permettant d'expliciter les vairables mesurées (entêtes des colonnes, unités utilisées, acronymes...)
Exemple de fichier Readme.txt
BACK
4. CONTENU----------------------------------------------------------------------------------------------------------------------------Liste des fichiers[NomFichier_1] : [NomFichier_2] : [NomFichier_3] : [Archive Zip 1] : [Description des fichiers contenus dans le dossier Zip, par exemple Imageset1]Informations complémentairesOrganisation des fichiers :Formats et structure des fichiers: Versions : Logiciel requis (en majuscules - préciser sa version) :----------------------------------------------------------------------------------------------------------------------------5. METHODE et TRAITEMENT----------------------------------------------------------------------------------------------------------------------------Cette section doit décrire la manière dont le contenu du jeu de données a été généré : l'équipement, le matériel/ les logiciels (préciser la version), les algorithmes, les formules, les procédures expérimentales/les protocoles, comment les données ont été modifiées ou traitées (par exemple, normalisées), etc.Si ces informations sont disponibles dans un document séparé, elles doivent être référencées ou stockées conjointement avec les données au format PDF.Les publications associées peuvent être référencées à partir de l'enregistrement des métadonnées du jeu de données.----------------------------------------------------------------------------------------------------------------------------6. INFORMATIONS ASSOCIEES------------------------------------------------------------------------------------------------------------------------------[Identifier les informations contextuelles, les métadonnées et toute autre informationnécessaire à l'utilisateur pour interpréter pleinement, comprendre et utiliser ce jeu de données ; savoir où et comment accéder aux données.]
0. SOMMAIRE------------------------------------------------------------------------------------------------------------------------------1. Projet2. Jeux de données3. Conditions d'utilisation 4. Contenu5. Méthode et traitement6. Informations associées => Données associées----------------------------------------------------------------------------------------------------------------------------1. PROJET----------------------------------------------------------------------------------------------------------------------------Titre (en majuscules) : Dates : [Début/fin du projet]Organisme financeur : Numéro de subvention :----------------------------------------------------------------------------------------------------------------------------2. JEUX DE DONNEES----------------------------------------------------------------------------------------------------------------------------Titre :Description : [Résumé ou brève description du jeu de données]Année de publication :Créateur(s)Prénomo NOM: Organisme(s) : Sources (si applicable): [Citations de données provenant d'autres sources] ----------------------------------------------------------------------------------------------------------------------------3. CONDITIONS D'UTILISATION----------------------------------------------------------------------------------------------------------------------------[Cette section doit fournir des informations sur les droits de propriété intellectuelle, les droits statutaires, les licences et les conditions d'utilisation/restrictions.]
README
BACK
4. CONTENU----------------------------------------------------------------------------------------------------------------------------Liste des fichiers[NomFichier_1] : [NomFichier_2] : [NomFichier_3] : [Archive Zip 1] : [Description des fichiers contenus dans le dossier Zip, par exemple Imageset1]Informations complémentairesOrganisation des fichiers :Formats et structure des fichiers: Versions : Logiciel requis (en majuscules - préciser sa version) :----------------------------------------------------------------------------------------------------------------------------5. METHODE et TRAITEMENT----------------------------------------------------------------------------------------------------------------------------Calibrage du banc d'essai :Flux magnétique :Fréquence des ondes électromagnétiques :Puissance électrique :Durée de la charge :----------------------------------------------------------------------------------------------------------------------------6. INFORMATIONS ASSOCIEES------------------------------------------------------------------------------------------------------------------------------[Identifier les informations contextuelles, les métadonnées et toute autre informationnécessaire à l'utilisateur pour interpréter pleinement, comprendre et utiliser ce jeu de données ; savoir où et comment accéder aux données.]
0. SOMMAIRE------------------------------------------------------------------------------------------------------------------------------1. Projet2. Jeux de données3. Conditions d'utilisation 4. Contenu5. Méthode et traitement6. Informations associées => Données associées----------------------------------------------------------------------------------------------------------------------------1. PROJET----------------------------------------------------------------------------------------------------------------------------Titre (en majuscules) : Dates : [Début/fin du projet]Organisme financeur : Numéro de subvention :----------------------------------------------------------------------------------------------------------------------------2. JEUX DE DONNEES----------------------------------------------------------------------------------------------------------------------------Titre :Description : [Résumé ou brève description du jeu de données]Année de publication :Créateur(s)Prénomo NOM: Organisme(s) : Sources (si applicable): [Citations de données provenant d'autres sources] ----------------------------------------------------------------------------------------------------------------------------3. CONDITIONS D'UTILISATION----------------------------------------------------------------------------------------------------------------------------[Cette section doit fournir des informations sur les droits de propriété intellectuelle, les droits statutaires, les licences et les conditions d'utilisation/restrictions.]
CONFIDENTIEL
/
NON PUBLIE
RAS
RAS
RAS
20240809_exp_QuantumLeap_RawData_v01.bin
20240124_exp_QuantuLeap_TreatedData_v03.csv
20180608
20240224_exp_QuantumLeap_TravelLogs.txt
README
90 T
145 s
9 GW
80 THz
DARKO
145 s
DARKOWARE 2.0
9 GW
80 THz
DARKO
90 T
Archibald SNOW
Archibald SNOW
Retour au menu
DarkoWare 2.0
METADONNEES OK
DATA CURATOR
Firewall détecté. Code de désactivation ?
Retour au menu
Es-tu prêt à partager tes données ?
OUI
NON
DATA CURATOR
Grâce à son partenariat avec le Ministère de l'enseignemen supérieur, DATA CURATOR te permet de déposer tes jeux de données sur l'entrepôt recherche.data.gouv (ou un autre) en quelques clics !Il te suffit pour cela de répondre à quelques questions pour vérifier que tu as le droit de partager ces données et qu'elles pourront facilement être réutilisées par d'autres chercheurs.
Diffuser tes données
DATA CURATOR
Grâce à son partenriat avec le Ministère de l'enseignemen supérieur, DATA CURATOR te permet de déposer tes jeux de données sur l'entrepôt recherche.data.gouv en quelques clics !Il te suffit opur cla de répondre à quelques questions pour vérifier que tu as le droit de partager ces données et qu'elles pourront facilement être réutilisées par d'autres chercheurs.
Retour au menu
Diffusion
Données
des
Diffuser tes données
Start >
Diffusion
Données
Start >
des
partager ses données : oui, mais...
– As-tu le droit de diffuser ces données ?
– Tes données sont-elles suffisamment bien organisées et documentées pour être compréhensibles ?
- Tes données sont-elles dans des formats ouverts ou largement partagés par ta communauté scientifique ?
– Tes données sont-elles accompagnées d'un identifiant pérenne et d'une licence de réutilisation ?
format propriétaire
Quelques vérifications s'imposent !
Propriété des données
Droits de diffusion
Réutilisabilité
1
2
4
3
choix de l'entrepôt et de la licence
Les données ont-elles été produites dans le cadre d'un partenariat industriel ?
OUI
NON
Retour
Diffusion possible sous conditions :se référer a l'accord de consortium ou au contrat entre partenaires
|alternative1|alternative2
N° du contrat :
Contrat identifié !
Retour
N° INCONNU !
Qui est titulaire des droits sur les données ?
Moi
Partage de propriété
Mon institution
Retour
|alternative1|alternative2
Diffusion possible sous réserve d'une règlementation ou d'un droit particulier
Code-barre de la preuve :
N° INCONNU !
Retour
|alternative1|alternative2
Diffusion possible avec l'accord des ayant-droits et sous réserve d'une règlementation ou d'un droit particulier
Absence de donnéesa cractère personnel confirmée !
Code-barre de la preuve :
N° INCONNU !
Retour
ECHEC du partage!
L'accord de consortium n'autorise pas le partage des données
Modifier les termes de l'accord ?
Piratage data curator en cours...
Pour modifier les termes de l'accord, prouvez que vous n'êtes pas un robot en résolvant le mini-jeu ci-dessous
Data curator
L'accord de consortium a été modifié et autorise le partage des données
bravo!
Votre institution est propriétaire des données et accepte de les partager
bravo!
1ere etape VALIDEE pour le partage !
format propriétaire
Quelques vérifications s'imposent !
Propriété des données
1
2
4
3
interdictions et obligations de diffusion
choix de l'entrepôt et de la licence
Réutilisabilité
Vos données contiennent-elles des données à caractère personnel ?
OUI
NON
Retour
|alternative1|alternative2
Vos données ne contiennent pas de données à caractère personnel
Code-barre de la preuve :
N° INCONNU !
Retour
Avez-vous anonymisé ou pseudonymisé ces données ?
OUI
NON
Retour
Vos données sont-elles protégées ou protégeables par un des droit suivants :
OUI
NON
- Données relatives à la sécurité, à la défense ou au secteur scientifique protégé
- Données soumises au secret professionnel
- Données relatives au secret des affaires
- Données protégées par le droit d'auteur
- Données relatives à une invention brevetable ou valorisable
- Base de données ou logicel
Retour
ECHEC du partage!
Interdiction de diffuser les données sans l'accord expresse des personnes concernées
ECHEC du partage!
L'analyse des données né décèle aucun processus d'anonymisation
ECHEC du partage!
L'analyse des données montre qu'elles sont soumises au secret défense
Pirater le système
Piratage data curator en cours...
ECHEC du partage!
Vos données ne peuvent être diffusées en l'état
Pirater le système
Piratage data curator en cours...
Pour pirater le système, prouvez que vous n'êtes pas un robot en résolvant le mini-jeu ci-dessous
Vos données ne sont pas soumises à un droit en interdisant ou en restreignant l'ouverture
bravo!
format propriétaire
Quelques vérifications s'imposent !
Propriété des données
Réutilisabilité
choix de l'entrepôt et de la licence
interdictions et obligations de diffusion
1
2
4
3
Vos données sont-elles correctement organisées et décrites ?
Retour
Fichiers correctement nommés ?
Données correctement décrites ?
Données nettoyées et exploitables ?
Vos données sont-elles dans des formats ouverts ?
OUI
NON
Retour
ECHEC du partage!
Vos données sont dans des formats propriétaires, ce qui limitera leur réutilisation
VALIDER
Prouvez-le en montrant que vuos savez ce qu'est un format ouvert : cochez ci-dessous les formats ouverts puis validez
Réinitialiser
Retour
format propriétaire
Quelques vérifications s'imposent !
Propriété des données
choix de l'entrepôt et de la licence
Réutilisabilité
interdictions et obligations de diffusion
1
2
4
3
Sous quelle licence souhaitez-vous partager vos données ?
|Etalab|etalab|Licence ouverte|licence ouverte|Open licence|open licence|Creative Commons|creative commons|Creative commons|CC|CC-BY|Licences CC|cc|cc by|CC BY|cc-by
|Apache|apache|BSD|CeCILL|GNU|MIT|cecill|mit|gnu|bsd
AU MOINS UNE REPONSE FAUSSE !
Pour le logiciel Darkoware 2.0 :
Licences validées !
Pour les données :
|Recherche data gouv|recherche data gouv|Recherche.data.gouv|recherche.data.gouv
ENTREPÔT INCONNU !
Nom de l'entrepôt :
Entrepôt validé !
Sous quelle licence souhaitez-vous partager vos données ?
format propriétaire
Quelques vérifications s'imposent !
choix de l'entrepôt et de la licence
Propriété des données
interdictions et obligations de diffusion
Réutilisabilité
Données diffusées
1
2
4
3
Toutes les vérifications ont été faites !