Want to create interactive content? It’s easy in Genially!

Get started free

PGDR

bibliodir

Created on March 26, 2021

Start designing with a free template

Discover more than 1500 professional designs like these:

Transcript

Plan de gestion des données de recherche

EMANUELA CHIRIAC

Service de la bibliothèque Université du Québec en Outaouais 14 mai 2021

Index

01. Politique sur les données de recherche

04. Sauvegarde et gestion des fichiers

07. Considérations éthiques et légales

08. Ressources

02. Quelques définitions

05. Publication / diffusion

03. Plan de gestion des données de recherche

06. Options de dépôt

09. Support

.01

Politique

Mise en oeuvre

C'est officiel!

La Politique des trois organismes subventionnaires canadiens sur les données de recherche a été adoptée le 15 mars 2021. Elle prescrit les responsabilités des chercheurs et des établissements bénéficiaires du financement fédéral en ce qui a trait à la gestion responsable des données de recherche.

Les premières opportunités de financement assujetties aux exigences du plan de gestion des données de recherche seront annoncées avant le printemps 2022.

info

La gestion des données de recherche est un élément nécessaire de l’excellence en recherche. " Toutes les demandes de subvention soumises aux organismes subventionnaires devraient inclure des méthodologies qui tiennent compte des meilleures pratiques en matière de gestion des données de recherche. "

Politique des trois organismes subventionnaires canadiens sur la gestion des données de recherche, 1/4

Les plans de gestion des données sont des documents évolutifs qui peuvent être modifiés pour tenir compte de changements au cours d’un projet de recherche. " Leur contenu et leur longueur varieront selon le projet de recherche, mais tous les plans doivent détailler sur:

  • comment les données seront recueillies, documentées, formatées, protégées et conservées;
  • comment les données seront utilisées;
  • comment les données seront communiquées, le cas échéant;
  • le lieu d'entreposage;
  • les rôles et responsabilités des membres de l'équipe;
  • les contraintes éthiques, juridiques et commerciales.

Politique des trois organismes subventionnaires canadiens sur la gestion des données de recherche, 2/4

Les titulaires de subvention sont tenus de déposer dans un dépôt numérique les données de recherche, les métadonnées et les codes qui appuient directement les conclusions de la recherche publiées dans des revues [...]. "

Le dépôt doit être effectué au moment de la publication.["

    Les titulaires de subvention ne sont pas tenus de partager leurs données [...] [Si] les éxigences éthiques, culturelles, juridiques et commerciales le permettent, [on s'attend à ce qu'ils] donnent un accès convenable aux données, conformément aux principes FAIR et aux normes propres à leurs disciplines. Dans la mesure du possible, ces données, ces métadonnées et ces codes doivent être liés à la publication à l’aide d’un identificateur numérique permanent. "

Politique des trois organismes subventionnaires canadiens sur la gestion des données de recherche, 3/4

    La recherche menée "par et avec" les collectivités, les regroupements collectifs et les organisations des Premières Nations, des Métis et des Inuits

Les plans de gestion des données seront élaborés conjointement avec ces intervenants [...]. Ces derniers détermineront comment les données sont recueillies, utilisées et préservées. Ils auront le droit de rapatrier les données (principe de la souveraineté des données autochtones). Cela pourrait donner lieu à des exceptions à l'exigence de dépôt des données."

Politique des trois organismes subventionnaires canadiens sur la gestion des données de recherche, 4/4

.01

Règlements connexes

Cadre de référence des trois organismes sur la conduite responsable de la recherche (2016)

Déclaration de principes des trois organismes sur la gestion des données numériques (2016)

Cadre et plan d’action des IRSC pour les données de la recherche en santé et les données liées à la santé (2017)

Politique des trois organismes sur le libre accès aux publications (2015)

INFO

Rendre ses données

MÉTADONNÉES

Établir des métadonnées qui seront lisibles par les humains et les machines. Il est essentiel que les métadonnées soient indexées par un moteur de recherche. Même lorsque les données sont confidentielles, les métadonnées restent accessibles et donc repérables.,

NORMES INTEROPÉRABLES

Si possible, utilisez des formats et des logiciels ouverts, non-propriétaires. Faites appel à des ontologies reconnues mondialement. Utilisez de l'encodage régulier de caractères : ASCII, Unicode, UTF-8.

IDENTIFIANTS PÉRENNES

Choisissez un dépôt qui assigne des DOI aux jeux de données. Créez-vous un profil ORCID.

DROITS DE RÉUTILISATION

Attribuez à vos données une licence ouverte à moins qu'il y ait des contraintes éthiques.

.02

Définitions

Données

Faits, mesures, enregistrements ou observations sur l’Univers recueillis par des scientifiques et d’autres personnes, assortis d’une interprétation minimale de leur contexte. Les données peuvent être présentées dans n’importe quelle forme et sur des supports variés (écrits, notes, chiffres, symboles, texte, illustrations, films, vidéos, enregistrements sonores, reproductions picturales, dessins, croquis ou autres représentations graphiques, manuels de procédures, formulaires, schémas, diagramme de marche du travail, descriptions d’équipement, fichiers de données, algorithmes de traitement, statistiques).

Données de recherche

Données essentiellement employées pour alimenter les enquêtes techniques ou scientifiques, la recherche, les études ou des activités artistiques. Les données de recherche peuvent être de nature expérimentale ou opérationnelle, émaner d’observations ou d’une tierce partie, être issues du secteur public, venir de la surveillance et comprendre des données traitées ou recyclées.

.02

.03

Plan de gestion des données

Les plans de gestion de données décrivent le mode de collecte, de formatage, de conservation et de partage des données; le mode d’utilisation des ensembles de données existantes; et la nature des nouvelles données qui seront créées. Ils aident aussi les chercheurs à déterminer les coûts, les avantages et les défis de la gestion des données. L’élaboration des plans devrait se faire à l’aide d’outils normalisés, lorsqu’ils sont disponibles.

Source: Déclaration de principes sur la gestion des données numériques, 2016

CYCLE DE VIE des données

PUBLICATION

CONSERVATION

STOCKAGE

April

February

DURANT DE PROJET

APRÈS LE PROJET

FIN DU PROJET

Le stockage et la sauvegarde concernent les tout premiers supports, pour les données initiales (brutes ou dérivées).

La publication correspond au partage, à la mise en disposition des données finales ou, pour les données sensibles, des métadonnées seulement.

Les données initiales ne seront pas nécessairement toutes conservées (tri). De la même manière, toutes les données conservées ne seront pas publiées.

Il ne s'agit pas d'une suite chronologique ! Le dépôt choisi au stade de la publication peut assurer aussi la préservation à long terme. La conservation concerne les données primaires et traitées, confidentielles et non-confidentielles.

Plan de gestion des données

Partage / réutilisation

Stockage / sauvegarde

Collecte de données

Considérations légales

Documents & métadonnées

Conservation

Responsabilités et ressources

Chiriac, E. (2021). Plan de gestion des données [schéma], licence CC-BY-SA

Portage. Plan de gestion des données. Exemple fictif

PGD au monde

Assistant GDR / DMP [Canada]

DMPonline[GB]

DMP Opidor [France]

DMP Tool [Université de Californie]

DMPonline [Pays-Bas]

QUT Data Management Plan

[sur le modèle de celui créé par UK DigitalCuration Centre]

Portage. Ressources de formation. https://portagenetwork.ca/fr/outils-et-ressources/ressources-de-formation-de-portage/?cn-reloaded=1

Assistant PDG

L'Assistant PGD 2.0 a été lancé le 3 mars 2021

Issu d'un partenariat entre l'ABRC (Association des bibliothèques de recherche canadiennes) et le Réseau Portage, l'Assistant PGD est un outil canadien bilingue de planification de la gestion des données. Des gabarits et des modèles thématiques sont disponibles à même la plateforme.

Possibilité de dupliquer les PDG.

Téléchargement sous différents formats.

Possibilité pour les établissements de personnaliser l'interface et les modèles.

Serveurs hébergés au Canada (Université d'Alberta).

Les plans peuvent être privés ou publics.

Assistant PGD se présente comme un formulaire questions - réponses. Consultez les derniers modèles de PGD ici.

COLLECTE DE DONNÉES

Quel type de données allez-vous collecter? Utiliserez-vous des données secondaires? Quels instruments ou quelles échelles de collecte utiliserez-vous? S'agit-il d'une collecte ponctuelle ou longitudinale? Quelle est la période de collecte? Quel est l'empacement géographique? Quelles seront les étapes de la collecte? Quels logiciels seront utilisés pour la collecte? Quels sera le format initial des fichiers?

ANALYSE DES DONNÉES

Comment allez-vous documenter les modifications que vous allez apporter à vos données? Quels logiciels utiliserez-vous pour l'analyse des données? Dans quel format seront sauvegardés les fichiers d'analyse? Quel système ou quelle méthode de codage sera utilisé pour l'analyse?Quelles mesures d'assurance de la qualité seront mises en oeuvre pour garantir l'exactitude et l'intégrité des données?

DOCUMENTATION ET MÉTADONNÉES

STOCKAGE ET SAUVEGARDE

Quel espace de stockage est nécessaire? Où seront stockées les données pendant la phase de collecte? Où seront stockées les données pendant la phase d'analyse? Comment seront protégées les données sensibles? Quelles conventions de nomenclature des fichiers seront utilisées?

Quels renseignements permettront la réutilisation et l'interprétation des données? Quels normes de métadonnées seront utilisées? Quelle est la population cible de l'étude? Comment la population est-elle échantillonnée? La population est-elle pondérée? Utiliserez-vous des acronymes ou abréviations?

CONFORMITÉ ÉTHIQUE ET JURIDIQUE

Avez-vous prévu le consentement éclairé? Qui détient la propriété intellectuelle sur les données? Quelles contraintes éthiques ou juridiques s'appliquent à vos données? Quelles mesure seont prises pour éviter la divulgation des informations personnelles?

PRÉSERVATION

Où seront conservées les données après le projet? Qui sera responsable de la gestion des données après l'étude? Prévoyez-vous une conversion des fichiers vers des formats pérennes? Combien de temps les données seront-elles conservées? Quelles mesures seront mises en place pour la destruction des données à la fin de la période de conservation?

PARTAGE DES DONNÉES

Quelles données pourront être partagées à la fin de l'étude? Qui sont les utilisateurs ou bénéficiaires probables de vos données? Décrivez les restrictions, le cas échéant. Où allez-vous partager les données? S'il y a des données protégées, comment on pourra y accéder? Quelle licence attribuerez-vous aux données?

RESPONSABILITÉS ET RESSOURCES

Indiquez les ressources financières nécessaires pour le projet. Indiquez les personnes-ressources du projet. Qui aura accès à vos données?

.04

Sauvegarde. Gestion des fichiers.

Règles d'or

La sécurité des données est le fondement de tout projet de recherche. Elle implique de la planification en termes d'infrastructure (support de conservation), de ressources humaines (gestion des accès, formation des utilisateurs) et financières (coûts de stockage).

  • Copies de sauvegarde locales et hors site.
  • Sauvegardes régulières (fréquence reliée à la quantité de données).
  • Contrôle des accès.
  • Organisation et nommage claires des fichiers pour une découverte rapide.
  • Formats pérennes.

L'intégrité des données ne se résume pas à une seule opération. Elle requiert des sauvegardes fréquentes et des vérifications périodiques, un chiffrement des données, éventuellement du versionnage, des conversions et des procédures de récupération. La sécurité des données est un processus à long terme !

.04

Bonnes pratiques (1)

Méthode de stockage

Règle du 3 - 2 - 1

ou ... Here - Near - Far

INFO

Source : MIT Libraries. (2020, 16 avril). Quick & dirty data management: the 5 things you need to be doing now!

.04

Bonnes pratiques (2)

Nommage et classification

Source: https://www.frdr-dfdr.ca/docs/fr/pr%C3%A9paration_de_vos_donn%C3%A9es/

INFO

Métadonnées, fichiers Read-me - gabarit https://guides.biblio.polymtl.ca/c.php?g=590745&p=4321359

.04

Bonnes pratiques (3)

Prévoir un manuel de codes ou un dictionnaire de données pour assurer leur bonne interprétation, ou encore un fichier Lisez-moi / Readme.

Les fichiers Lisez-moi contiennent généralement un descriptif des données et des méthodes de collecte, des informations sur les variables et les instruments de mesure (données quantitatives), sur le format de sauvegarde, sur les protocoles d'études et toute autre documentation connexe, ainsi que sur les éventuelles restrictions d'accès et de réutilisation.

voir DFDR/FRDR. Modèle de fichier LISEZ-MOI

.04

Bonnes pratiques (4)

Intégrité des données

L'intégrité et l'intelligibilité des données sont à risque en raison de l'obsolescence technologique. Les logiciels et les formats des fichiers évoluent constamment. Un archivage pérenne dépend de :

Les algorithmes les plus populaires de hashage sont: MD5, SHA-1 et SHA-256.Le hashage est une technique d'encyprage des données; en comparant le fichier et le code qui lui a été attribué, il est possible de vérfier si les données ont été altérées (modification, perte, etc.)

  • choix de format (format ouvert versus format propriétaire)
  • métadonnées adaptées (ex. OAIS ou Open Archive Initiative System)
  • empreinte digitale (somme de contrôle ou checksum)
  • propriété intellectuelle (voir données sensibles)

INFO

Format recommandé

Type de fichier

Rich Text Format (.rtf), PDF/A, XML, HTML, TXT (ASCII), MS Word (docx), Open Document Text (ODT)

Fichiers texte

SPSS (.sav), STATA (.dta) MS ACCESS (.mdb / accdb) SPSS Portable Format (.por)

Fichiers tabulaires

TIFF, PNG, JPEG, BMP, GIF SHAPEFILE (shp, dbf, shx), GeoTIFF, NetCDF, AutoCAD

Fichiers image

WAVE, AIFF, MP3, MXF, FLAC MOV, MPEG-4, AVI, MXF

Fichiers audio / vidéo

INFO

Fichiers texte

CONSERVATION

CONSERVATION

avec

avec

DATAVERSE

DFDR

Dataverse est une plateforme de dépôt libre, gratuite et sécuritaire.

Infrastructure de recherche numérique pancanadienne, issue d'un partenariat entre Portage, l'ABRC et Calcul Canada.

Supporte une variété de formats de fichiers. Les données peuvent être visualisées et analysées à même le navigateur.

Technologie de transfert supportant des jeux de données volumineux (Globus File Transfer). Jusqu'à 3 To par chercheur ou par groupe de recherche.

VS

Les données peuvent être publiques ou privées (partagées avec des individus ou groupes). Gestion granulaire des accès (au niveau des fichiers).

L'accès aux données doit être public. Une période d'embargo est acceptée. La plateforme ne supporte pas les fonctionnalités actives de gestion des données de recherche.

Possibilité de collaborer avec les autres intervenants du projet à même la plateforme.

Ne conserve pas les différentes versions. La mise à jour des jeux de données se fait par l'entremise d'un curateur.

Le dépôt des données et la gestion des différentes versions se font sans intermédiaire.

.05

Publication

Données intégrées dans un article

Data Paper

Données publiées à part

Source: https://doranum.fr/data-paper-data-journal/comment-publier-donnees-recherche/

Identification difficile des données indépendamment de l'article.

Repérage, réutilisation et citation facilitées.

Repérage difficile des données, chances de réutilisation diminuées.

INFO

Politiques éditoriales

Chaque éditeur a sa politique quant à la publication des données de recherche (données brutes ou traitées, logiciels, codes, algorithmes, protocoles, etc.)

Auteurs ou contributeurs?

La taxonomie CRediT (Contributor Roles Taxonomy) permet d'identifier les rôles et d'assurer la reconnaissance de tous les contributeurs.

INFO

INFO

.06

Options de dépôt

Critères de sélection:

Memento

Le choix du dépôt aura des répercussions physiques (intégrité des données), monétaires et légales (conditions de partage, utiisation secondaire des données, confidentialité, conformité à la politique sur le libre accès, etc.).

  • Est-ce que le répertoire garantit la préservation à long terme?
  • Accepte-t-on des données confidentielles ?
  • Quel est le coût d'entreposage (par dataset ou GB) ?
  • Quel est le lieu physique des serveurs ?
  • Y a-t-il une licence par défaut ?
  • Peut-on contrôler les accès au niveau de fichiers ou de la collection ?
  • Le répertoire est-il certifié ?

https://www.nature.com/sdata/policies/repositories

Open DOAR https://v2.sherpa.ac.uk/opendoar/

Dépôts disciplinaires

ANNUAIRES

Dépôts multidisciplinaires

re3data (Registry of Research Data Repository)

Dépôts institutionnels

OAD (Open Access Directory / Data Repositories)

Open DOAR (Directory of Open Access Repositories)

Dépôts fournis par éditeurs

ROAR (Registry of Open Access Repositories)

Dépôts thématiques

INFO

Politique sur le libre accès, 2015

Source: http://www.science.gc.ca/eic/site/063.nsf/fra/h_F6765465.html

.07

Considérations éthiques

Paternité des résultats Droits de réutilisation Choix du type de publication Publication des résultats négatifs

Protection en matière de biosécurité Reproductibilité

Tiré de : IRSC. Éthique en recherche: une aproche fondée sur le cycle de vie scientifique (2018)

Représentation adéquate de sexe et de genre

Sélection équitable des participants

INFO

Chap. 3 Consentement libre, éclairé et continu des participants.

Énoncé de politique des trois conseils : Éthique de la recherche avec des êtres humains - EPTC 2 (2018)

Chap. 5 Confidentialité : obligation de protéger l'information contre l'accès, l'utilisation, la divulgation et la modification non autorisés, d'une part, et contre la perte et le vol, d'autre part. Respect de la vie privée : attention aux renseignements identificatoires ou personnels (ex. âge, ethnicité, formation scolaire, religion, historique médical ou professionnel, statut social) !

Politique d'éthique de la recherche avec des êtres humains de l'UQO [dernière modification 9 février 2021]

Chap. 9 Recherche impliquant les Premières Nations, les Inuits ou les Métis du Canada : respect des coutumes et des codes de pratique communautaires.

Tenue des dossiers : Conserver des dossiers complets et exacts pour les données, les méthodes et les résultats, y compris les graphiques et les images, conformément à l’entente de financement applicable, aux politiques de l’établissement, aux lois et aux règlements, ainsi qu’aux normes professionnelles ou disciplinaires, de façon à permettre la vérification ou la reproduction des travaux.

Cadre de référence des trois organismes sur la conduite responsable de la recherche (2016)

« Accès » affirme que, quel que soit l’endroit où se trouvent des renseignements et données concernant les Premières Nations et leurs collectivités, celles-ci doivent y avoir accès. Ce principe confirme également le droit des collectivités et des organisations des Premières Nations de prendre des décisions concernant l’accès à leur information collective et la gestion de cet accès.

« Contrôle » exprime que les Premières Nations, leurs collectivités et les organismes qui les représentent ont le droit d’exiger le contrôle de l’intégralité de la recherche et des processus de gestion de l’information les concernant. Le contrôle de la recherche peut comprendre toutes les étapes d’un projet, du début à la fin.

« Propriété » : une collectivité ou un groupe est collectivement propriétaire de l’information, à l’instar d’un individu qui est naturellement propriétaire de ses renseignements personnels.

La « possession » est un principe [...] qui définit la relation qui existe entre un peuple et l’information le concernant. Elle fait référence au contrôle physique des données. [C']est le mécanisme permettant de faire valoir et de protéger la propriété.

Renseignements personnels

Propriété des données

INFO

LOI SUR L'ACCÈS AUX DOCUMENTS DES ORGANISMES PUBLICS ET SUR LA PROTECTION DES RENSEIGNEMENTS PERSONNELS

LOI CANADIENNE DU DROIT D'AUTEUR

On ne protège pas les données brutes ou factuelles non interprétées, mais bien les compilations / oeuvres de l'esprit qui font preuve de talent et du jugement!

Art. 53 Les renseignements personnels sont confidentiels, sauf si la personne concernée consente à leur divulgation.

Art. 54 Sont personnels les renseignements qui concernent une personne physique et permettent de l'identifier.

Les données de recherche sont considérées des biens publics non-exclusifs et non-rivaux. Leur gestion se fait au bénéfice de tous.

Art. 56 Le nom d'une personne physique n'est pas un renseignement personnel, sauf lorsqu'il est mentionné avec un autre renseignement la concernant ou lorsque sa seule mention révèlerait un renseignement personnel concernant une personne.

Pas de propriété matérielle, mais plutôt gestion fiduciaire (ex. chercheur - institution - patient). Les gestionnaires (gardiens) contrôlent l'accès et le partage aux données.

.09

Support

Consultez la page consacrée à la gestion des données de recherche sur le site web de la bibliothèque

Équipe GDR à l'UQO

Un groupe de travail institutionnel a été créé en 2019 avec l'objectif de cibler les intervenants, de préciser les rôles et responsabilités de chaque service concerné, enfin d'amorcer une concertation entre tous ces acteurs. Stratégie institutionnelle: à venir! Accompagnement à l'utilisation de Dataverse et de l'Assistant PGD. Présentations aux professeurs et chercheurs sur demande.

Envoyez vos questions et commentaires à:

gdr@uqo.ca

DPC (Digital Preservation Coalition). Digital Preservation Handbook.

.08

Ressources

  • DORANum. Données de la recherche. Apprentissage numérique. https://doranum.fr/
  • Portage. Créer un plan de gestion des données efficace [guide sommaire].
  • Portage. Options de dépôt au Canada: un guide de Portage.
  • Portage. Ressources de formation de Portage. https://portagenetwork.ca/fr/outils-et-ressources/ressources-de-formation-de-portage/?cn-reloaded=1
  • Michener, K. M. (2015). Ten Simple Rules for Creating a Good Data Management Plan. PLoS Comput Biol 11(10): e1004525. https://doi.org/10.1371/journal.pcbi.1004525
  • Scassa, T. (2018). Data Ownership. CIGI Papers, no. 187. https://www.cigionline.org/sites/default/files/documents/Paper%20no.187_2.pdf
  • UK Data Service. Prepare and Manage Data. https://www.ukdataservice.ac.uk/manage-data.aspx

Questions ?

Got an idea?

Use this space to add awesome interactivity. Include text, images, videos, tables, PDFs... even interactive questions! Premium tip: Get information on how your audience interacts with your creation:

  • Visit the Analytics settings;
  • Activate user tracking;
  • Let the communication flow!

Got an idea?

Use this space to add awesome interactivity. Include text, images, videos, tables, PDFs... even interactive questions! Premium tip: Get information on how your audience interacts with your creation:

  • Visit the Analytics settings;
  • Activate user tracking;
  • Let the communication flow!

Got an idea?

Use this space to add awesome interactivity. Include text, images, videos, tables, PDFs... even interactive questions! Premium tip: Get information on how your audience interacts with your creation:

  • Visit the Analytics settings;
  • Activate user tracking;
  • Let the communication flow!

Got an idea?

Use this space to add awesome interactivity. Include text, images, videos, tables, PDFs... even interactive questions! Premium tip: Get information on how your audience interacts with your creation:

  • Visit the Analytics settings;
  • Activate user tracking;
  • Let the communication flow!

Got an idea?

Use this space to add awesome interactivity. Include text, images, videos, tables, PDFs... even interactive questions! Premium tip: Get information on how your audience interacts with your creation:

  • Visit the Analytics settings;
  • Activate user tracking;
  • Let the communication flow!