dataCurator_v2
bibliotheque
Created on October 26, 2023
More creations to inspire you
SLYCE DECK
Personalized
LET’S GO TO LONDON!
Personalized
ENERGY KEY ACHIEVEMENTS
Personalized
HUMAN AND SOCIAL DEVELOPMENT KEY
Personalized
CULTURAL HERITAGE AND ART KEY ACHIEVEMENTS
Personalized
DOWNFALLL OF ARAB RULE IN AL-ANDALUS
Personalized
ABOUT THE EEA GRANTS AND NORWAY
Personalized
Transcript
10:00
|Documentation
DATA CURATOR
Pour déverrouiller, complétez les mots manquants (en respectant les majuscules !) :
|Description
|éthiques
|conservation
|Partage
|Stockage
Plan de gestion de données
1.
Modèle
des données et collecte ou réutilisation de
données existantes
2.
et qualité des données
3.
et sauvegarde pendant le processus de recherche
4.
Exigences légales et
5.
6.
des données et
à long terme.
Responsabilités et ressources en matière de gestion des données.
Valider
DATA CURATOR
Voici les étapes du cycle de vie des données. Clique sur celle qui t'intéresse !
Planifier
Partager
Collecter
Archiver
Réutiliser
Traiter
DATA CURATOR
Voici les étapes du cycle de vie des données. Clique sur celle qui t'intéresse !
Partager
Planifier
Collecter
Archiver
Réutiliser
Traiter
DATA CURATOR
Planifier
Retour au menu
Le plan de gestion des données (PGD ; DMP en anglais) est un outil de gestion de projet. Il se présente sous forme d’un document structuré en rubriques. Il a pour objectif de synthétiser la description et l’évolution des jeux de données de votre projet de recherche. Il prépare le partage, la réutilisation et la pérennisation des données.
DMP OPIDoR est un outil d’aide à la création en ligne de plans de gestion de données mis à disposition de l’Enseignement Supérieur et de la Recherche.
DATA CURATOR
Créer de nouvelles donnéesRécupérer et retravailler des données existantes
Allez-vous :
Retour au menu
StockageSauvegarde
DATA CURATOR
Que voulez-vous savoir ?
Retour au menu
Collecter
Comment organiser mes dossiers ?
Comment nommer mes fichiers ?
Comment ajouter des métadonnées ?
Où dupliquer et stocker mes données ?
DATA CURATOR
Quels supports de stockage choisir ?
Retour au menu
Ordinateur
DDisque/clé externe
Serveur institutionnel
Serveur cloud privé
Collecter
DATA CURATOR
Pour un stockage temporaire ; nécessité de crypter ou sécuriser physiquement les données sensibles
Conseil
SECURITE
ACCES
COUT
BILAN
Règle du 3+2+1 contre la perte de données 3 exemplaires sur 2 supports différents dont au moins 1 copie hors site (hos du bureau ou de l'organisation)
Collecter
BACK
DATA CURATOR
Pour un stockage temporaire ; nécessité de crypter les données sensibles
BILAN
SECURITE
ACCES
COUT
Conseil
Règle du 3+2+1 contre la perte de données 3 exemplaires sur 2 supports différents dont au moins 1 copie hors site (hors du bureau ou de l'organisation)
Collecter
BACK
DATA CURATOR
SECURITE
ACCES
COUT
Pour un stockage plus pérenne ; Adapté pour le stockage de données sensibles et des versions "stables" de vos données
BILAN
SECURITE
ACCES
COUT
Conseil
Règle du 3+2+1 contre la perte de données 3 exemplaires sur 2 supports différents dont au moins 1 copie hors site (hors du bureau ou de l'organisation)
BACK
Collecter
DATA CURATOR
Ne pas y mettre de données sensibles ; pas de contrôle sur la procédure de sauvegarde, le lieu de stockage et le devenir des données
BILAN
Règle du 3+2+1 contre la perte de données 3 exemplaires sur 2 supports différents dont au moins 1 copie hors site (hors du bureau ou de l'organisation)
SECURITE
ACCES
COUT
Conseil
Collecter
BACK
DATA CURATOR
Retour au menu
Vous voulez des conseils sur :
Organisation des dossiers
Nommage des fichiers
Collecter
DATA CURATOR
Pas de règle absolue pour l'organisation des dossiers, mais l'objectif est d'éviter la perte de données, tout en optimisant leur réutilisation, par vous-même ou un autre chercheur. Il faut donc :
- Trouver l'équilibre dans la profondeur de l'arborescence.
- Organiser les dossiers et sous-dossiers de façon logique : par projet, expérience, date, type de données (brutes vs analysées)...
VOIR UN EXEMPLE D'ARBORESCENCE
- Mettre un fichier Readme.txt dans chaque dossier pour expliquer le type de données qui s'y trouve.
Collecter
BACK
DATA CURATOR
Collecter
BACK
DATA CURATOR
5 règles pour bien nommer ses fichiers :
Donner un nom bref et explicite
Ne pas mettre d'espace ni de caractères spéciaux
Indiquer les dates au formatAAAA-MM-JJ
Placer l'élément important en premier
Indiquer les versions des fichiers
Collecter
BACK
DATA CURATOR
Retour au menu
Traiter
Avant de traiter et d'analyser ses données, assurez-vous qu'elles soient "propres".Pour cela, rien de tel qu'un petit nettoyage !
DATA CURATOR
Retour au menu
Traiter
Vérifier l'orthographe et les fautes de frappe
Supprimer les doublons
Harmoniser le vocabulaire, l'utilisation des MAJ/min, le formatage des dates
Attention aux espaces et caractères invisibles
Evitez les abbréviations non explicitées
6 règles pour bien nettoyer ses données :
Précisez les unités de mesure
DATA CURATOR
Retour au menu
Collecter
La description des données doit être suffisante pour assurer leur validation, reproductibilité et réutilisation : titre explicite, date description, technologie, organisme, mots clés, etc.
Il est recommandé d'utiliser des standards de métadonnées (liste de champs descriptifs des données) lorsqu'ils existent dans votre discipline. Il existe également des standards généralistes comme le Dublin Core.
Les données doivent aussi être accompagnées d'une documentation permettant leur réutilisation. Par exemple :
- Un document (fichier Readme par exemple) expliquant le contexte, la méthodologie, les outils / logiciels utilisés peut être utilisé
- Un dictionnaire de données permettant d'expliciter les vairables mesurées (entêtes des colonnes, unités utilisées, acronymes...)
Exemple de fichier Readme.txt
4. CONTENU----------------------------------------------------------------------------------------------------------------------------Liste des fichiers[NomFichier_1] : [NomFichier_2] : [NomFichier_3] : [Archive Zip 1] : [Description des fichiers contenus dans le dossier Zip, par exemple Imageset1]Informations complémentairesOrganisation des fichiers :Formats et structure des fichiers: Versions : Logiciel requis (en majuscules - préciser sa version) :----------------------------------------------------------------------------------------------------------------------------5. METHODE et TRAITEMENT----------------------------------------------------------------------------------------------------------------------------Calibrage du banc d'essai :Flux magnétique :Fréquence des ondes électromagnétiques :Puissance électrique :Durée de la charge :----------------------------------------------------------------------------------------------------------------------------6. INFORMATIONS ASSOCIEES------------------------------------------------------------------------------------------------------------------------------[Identifier les informations contextuelles, les métadonnées et toute autre informationnécessaire à l'utilisateur pour interpréter pleinement, comprendre et utiliser ce jeu de données ; savoir où et comment accéder aux données.]
0. SOMMAIRE------------------------------------------------------------------------------------------------------------------------------1. Projet2. Jeux de données3. Conditions d'utilisation 4. Contenu5. Méthode et traitement6. Informations associées => Données associées----------------------------------------------------------------------------------------------------------------------------1. PROJET----------------------------------------------------------------------------------------------------------------------------Titre (en majuscules) : Dates : [Début/fin du projet]Organisme financeur : Numéro de subvention :----------------------------------------------------------------------------------------------------------------------------2. JEUX DE DONNEES----------------------------------------------------------------------------------------------------------------------------Titre :Description : [Résumé ou brève description du jeu de données]Année de publication :Créateur(s)Prénomo NOM: Organisme(s) : Sources (si applicable): [Citations de données provenant d'autres sources] ----------------------------------------------------------------------------------------------------------------------------3. CONDITIONS D'UTILISATION----------------------------------------------------------------------------------------------------------------------------[Cette section doit fournir des informations sur les droits de propriété intellectuelle, les droits statutaires, les licences et les conditions d'utilisation/restrictions.]
CONFIDENTIEL
/
NON PUBLIE
RAS
RAS
RAS
20240809_exp_QuantumLeap_RawData_v01.bin
20240124_exp_QuantuLeap_TreatedData_v03.csv
20180608
20240224_exp_QuantumLeap_TravelLogs.txt
README
90 T
145 s
9 GW
80 THz
DARKO
145 s
DARKOWARE 2.0
9 GW
80 THz
DARKO
90 T
Archibald SNOW
Archibald SNOW
Retour au menu
DarkoWare 2.0
METADONNEES OK
DATA CURATOR
Firewall détecté. Code de désactivation ?
Retour au menu
DATA CURATOR
Voici les étapes du cycle de vie des données. Clique sur celle qui t'intéresse !
Partager
Planifier
Collecter
Archiver
Réutiliser
Traiter
IMPORT
Es-tu prêt à partager tes données ?
OUI
NON
DATA CURATOR
Grâce à son partenriat avec le Ministère de l'enseignemen supérieur, DATA CURATOR te permet de déposer tes jeux de données sur l'entrepôt recherche.data.gouv en quelques clics !Il te suffit opur cla de répondre à quelques questions pour vérifier que tu as le droit de partager ces données et qu'elles pourront facilement être réutilisées par d'autres chercheurs.
Diffuser tes données
OUI
Les principes juridiques et éthiques sont-ils respectés ?
NON
Vous devez être particulièrement vigilant sur les données à caractère personnel, c’est-à-dire les informations qui permettent d’identifier directement ou indirectement une personne physique (nom, prénom, numéro de téléphone, de sécurité sociale, etc.).Dans ce cas, référez-vous à la CNIL ou au DPD (Délégué à la Protection des données) de votre organisme.
Vos données contiennent-elles des informations à caractère personnel ?
N° de l'élément de preuve :
OUI
As-tu vérifié ou obtenu les droits de diffusion des données ?
NON
Les données ne sont pas considérées comme des oeuvres de l'esprit ; le droit d'auteur ne s'applique pas (sauf dans le cas des bases de données).La propriété des données appartient au producteur des données, c'est-à-dire la personne physique ou morale ayant financé les coûts de production des données.
Etes-vous propriétaire des données ou avez-vous l'accord du propriétaire des donnes pour les diffuser ?
N° de l'élément de preuve :
Les données financées au moins à moitié par des fonds publics sont considérées comme des documents administratifs et doivent être par défaut ouvertes. Certaines données peuvent cependant faire l’objet d’une interdiction de diffusion (sécurité publique, secret défense, secrets professionnels...)
As-tu défini les modalités d'accès aux données ?
OUI
NON
Suivant l’entrepôt, il vous sera possible de choisir un accès ouvert ou un accès restreint (à une communauté scientifique par exemple). Vous pourrez également déposer vos données mais les rendre accessibles plus tard en décidant d’un embargo.
Souhaitez-vous que les données soient immédiatement accessibles ?
N° de l'élément de preuve :
Les fichiers sont-ils nommés et organisés de manière explicite ?
OUI
NON
Vos données doivent être organisées correctement pour un traitement informatique ou une intégration dans une base de données.Nommez de façon claire et cohérente vos dossiers et fichiers. Les dénominations doivent avoir du sens et refléter le contenu. Vous pouvez suivre quelques règles pour éviter toute confusion, suppression accidentelle ou problème d’affichage (pas de caractères spéciaux, pas d’accents, pas d’espaces, pas de mots vides, etc.). Créez votre propre convention de nommage pour qu’elle convienne à votre contexte et à vos collaborateurs.
Vos fichiers sont-ils nommés et organisés de manière explicite ?
N° de l'élément de preuve :
Les fichiers sont-ils dans des formats ouverts et pérennes ?
OUI
NON
Vous devez utiliser des formats de fichiers acceptés par l’entrepôt choisi. Dans tous les cas, il est préférable d’éviter les formats fermés et de privilégier les formats ouverts ou largement répandus, afin que vos données puissent être lues et réutilisées. Convertissez le format de vos fichiers si besoin, par exemple un format XLS (format Excel fermé) vers un format CSV (format ouvert).
Vos fichiers sont-ils dans des formats ouverts et pérennes ?
N° de l'élément de preuve :
OUI
Les données sont-elles décrites et documentées ?
La description des données doit être suffisante pour assurer leur validation, reproductibilité, réutilisation. Vos données doivent donc être bien décrites : titre explicite, description, technologie, organisme, mots clés, etc.
NON
Il est également nécessaire de fournir la documentation qui permet la réutilisation de vos données : par exemple, un fichier Readme) expliquant le contexte, la méthodologie, les outils/logiciels utilisés et toutes les informations indispensables à la réutilisation de vos données.Un dictionnaire de données permettant d’expliciter les variables mesurées peut également être fourni séparément. Par exemple, pour un fichier tabulé, il peut être nécessaire de spécifier les entêtes des colonnes, les unités utilisées, les acronymes, etc.
Vos données sont-elles correctement décrites et documentées ?
N° de l'élément de preuve :
OUI
Un identifiant unique pérenne est-il attribué aux données ?
L’entrepôt attribue généralement un identifiant pérenne ou un accession number. Recherche data gouv attribue par exemple un DOI pour chaque jeu de données déposé.Pour les codes sources, il est recommandé de les déposer dans l’archive universelle Software Heritage qui attribue un identifiant SWHID.
NON
Vos données disposent-elles ou disposeront-elles d'un identifiant unique pérenne ?
N° de l'élément de preuve :
Une licence appropriée est-elle attribuée aux données ?
Une licence de diffusion est indispensable pour définir les conditions de réutilisation des données. Pour favoriser le partage, il est souhaitable de choisir une licence la plus ouverte possible, permettant une utilisation libre et sans restriction. L’entrepôt peut vous proposer plusieurs licences au choix. Une licence précise peut également vous être imposée.
Quelle licence souhaitez-vous attribuer à votre jeu de données ?
Données ouvertes.