Want to make creations as awesome as this one?

Transcript

EMANUELA CHIRIAC

Service de la bibliothèqueUniversité du Québec en Outaouais14 mai 2021

Plan de gestion des données de recherche

09. Support

08. Ressources

07. Considérations éthiques et légales

06. Options de dépôt

05. Publication / diffusion

04. Sauvegarde et gestion des fichiers

03. Plan de gestion des données de recherche

02. Quelques définitions

01. Politique sur les données de recherche

Index

.01

info

Les premières opportunités de financement assujetties aux exigences du plan de gestion des données de recherche seront annoncées avant le printemps 2022.

Mise en oeuvre

Politique

C'est officiel!

La Politique des trois organismes subventionnaires canadiens sur les données de recherche a été adoptée le 15 mars 2021.Elle prescrit les responsabilités des chercheurs et des établissements bénéficiaires du financement fédéral en ce qui a trait à la gestion responsable des données de recherche.

Politique des trois organismes subventionnaires canadiens sur la gestion des données de recherche, 1/4

La gestion des données de recherche est un élément nécessaire de l’excellence en recherche. " Toutes les demandes de subvention soumises aux organismes subventionnaires devraient inclure des méthodologies qui tiennent compte des meilleures pratiques en matière de gestion des données de recherche. "

Politique des trois organismes subventionnaires canadiens sur la gestion des données de recherche, 2/4

  • comment les données seront recueillies, documentées, formatées, protégées et conservées;
  • comment les données seront utilisées;
  • comment les données seront communiquées, le cas échéant;
  • le lieu d'entreposage;
  • les rôles et responsabilités des membres de l'équipe;
  • les contraintes éthiques, juridiques et commerciales.

Les plans de gestion des données sont des documents évolutifs qui peuvent être modifiés pour tenir compte de changements au cours d’un projet de recherche. "Leur contenu et leur longueur varieront selon le projet de recherche, mais tous les plans doivent détailler sur:

Le dépôt doit être effectué au moment de la publication.["

Politique des trois organismes subventionnaires canadiens sur la gestion des données de recherche, 3/4

    Les titulaires de subvention ne sont pas tenus de partager leurs données [...] [Si] les éxigences éthiques, culturelles, juridiques et commerciales le permettent, [on s'attend à ce qu'ils] donnent un accès convenable aux données, conformément aux principes FAIR et aux normes propres à leurs disciplines. Dans la mesure du possible, ces données, ces métadonnées et ces codes doivent être liés à la publication à l’aide d’un identificateur numérique permanent. "

Les titulaires de subvention sont tenus de déposer dans un dépôt numérique les données de recherche, les métadonnées et les codes qui appuient directement les conclusions de la recherche publiées dans des revues [...]. "

Politique des trois organismes subventionnaires canadiens sur la gestion des données de recherche, 4/4

    La recherche menée "par et avec" les collectivités, les regroupements collectifs et les organisations des Premières Nations, des Métis et des Inuits

Les plans de gestion des données seront élaborés conjointement avec ces intervenants [...]. Ces derniers détermineront comment les données sont recueillies, utilisées et préservées. Ils auront le droit de rapatrier les données (principe de la souveraineté des données autochtones).Cela pourrait donner lieu à des exceptions à l'exigence de dépôt des données."

Politique des trois organismes sur le libre accès aux publications (2015)

Cadre de référence des trois organismes sur la conduite responsable de la recherche (2016)

Déclaration de principes des trois organismes sur la gestion des données numériques (2016)

.01

Règlements connexes

Cadre et plan d’action des IRSC pour les données de la recherche en santé et les données liées à la santé (2017)

Attribuez à vos données une licence ouverte à moins qu'il y ait des contraintes éthiques.

Si possible, utilisez des formats et des logiciels ouverts, non-propriétaires.Faites appel à des ontologies reconnues mondialement.Utilisez de l'encodage régulier de caractères : ASCII, Unicode, UTF-8.

Choisissez un dépôt qui assigne des DOI aux jeux de données. Créez-vous un profil ORCID.

DROITS DE RÉUTILISATION

NORMES INTEROPÉRABLES

IDENTIFIANTS PÉRENNES

INFO

MÉTADONNÉES

Établir des métadonnées qui seront lisibles par les humains et les machines.Il est essentiel que les métadonnées soient indexées par un moteur de recherche.Même lorsque les données sont confidentielles, les métadonnées restent accessibles et donc repérables.,

Rendre ses données

Faits, mesures, enregistrements ou observations sur l’Univers recueillis par des scientifiques et d’autres personnes, assortis d’une interprétation minimale de leur contexte. Les données peuvent être présentées dans n’importe quelle forme et sur des supports variés (écrits, notes, chiffres, symboles, texte, illustrations, films, vidéos, enregistrements sonores, reproductions picturales, dessins, croquis ou autres représentations graphiques, manuels de procédures, formulaires, schémas, diagramme de marche du travail, descriptions d’équipement, fichiers de données, algorithmes de traitement, statistiques).

Données essentiellement employées pour alimenter les enquêtes techniques ou scientifiques, la recherche, les études ou des activités artistiques. Les données de recherche peuvent être de nature expérimentale ou opérationnelle, émaner d’observations ou d’une tierce partie, être issues du secteur public, venir de la surveillance et comprendre des données traitées ou recyclées.

Données de recherche

Données

.02

Définitions

.02

Source: Déclaration de principes sur la gestion des données numériques, 2016

Les plans de gestion de données décrivent le mode de collecte, de formatage, de conservation et de partage des données; le mode d’utilisation des ensembles de données existantes; et la nature des nouvelles données qui seront créées. Ils aident aussi les chercheurs à déterminer les coûts, les avantages et les défis de la gestion des données. L’élaboration des plans devrait se faire à l’aide d’outils normalisés, lorsqu’ils sont disponibles.

.03

Plan de gestion des données

Il ne s'agit pas d'une suite chronologique ! Le dépôt choisi au stade de la publication peut assurer aussi la préservation à long terme.La conservation concerne les données primaires et traitées, confidentielles et non-confidentielles.

CONSERVATION

PUBLICATION

STOCKAGE

CYCLE DE VIE des données

Les données initiales ne seront pas nécessairement toutes conservées (tri). De la même manière, toutes les données conservées ne seront pas publiées.

APRÈS LE PROJET

La publication correspond au partage, à la mise en disposition des données finales ou, pour les données sensibles, des métadonnées seulement.

FIN DU PROJET

Le stockage et la sauvegarde concernent les tout premiers supports, pour les données initiales (brutes ou dérivées).

DURANT DE PROJET

April

February

Chiriac, E. (2021). Plan de gestion des données [schéma], licence CC-BY-SA

Considérations légales

Responsabilités et ressources

Conservation

Portage. Plan de gestion des données. Exemple fictif

Documents & métadonnées

Stockage / sauvegarde

Collecte de données

Partage / réutilisation

Plan de gestion des données

[sur le modèle de celui créé par UK DigitalCuration Centre]

QUT Data Management Plan

DMPonline[GB]

DMP Tool [Université de Californie]

DMPonline [Pays-Bas]

Assistant GDR / DMP [Canada]

DMP Opidor [France]

PGD au monde

Les plans peuvent être privés ou publics.

Serveurs hébergés au Canada (Université d'Alberta).

Possibilité pour les établissements de personnaliser l'interface et les modèles.

Téléchargement sous différents formats.

Possibilité de dupliquer les PDG.

Assistant PGD se présente comme un formulaire questions - réponses. Consultez les derniers modèles de PGD ici.

Portage. Ressources de formation. https://portagenetwork.ca/fr/outils-et-ressources/ressources-de-formation-de-portage/?cn-reloaded=1

L'Assistant PGD 2.0 a été lancé le 3 mars 2021 !

Assistant PDG

Issu d'un partenariat entre l'ABRC (Association des bibliothèques de recherche canadiennes) et le Réseau Portage, l'Assistant PGD est un outil canadien bilingue de planification de la gestion des données. Des gabarits et des modèles thématiques sont disponibles à même la plateforme.

Quel type de données allez-vous collecter?Utiliserez-vous des données secondaires?Quels instruments ou quelles échelles de collecte utiliserez-vous?S'agit-il d'une collecte ponctuelle ou longitudinale?Quelle est la période de collecte?Quel est l'empacement géographique?Quelles seront les étapes de la collecte?Quels logiciels seront utilisés pour la collecte?Quels sera le format initial des fichiers?

Comment allez-vous documenter les modifications que vous allez apporter à vos données?Quels logiciels utiliserez-vous pour l'analyse des données?Dans quel format seront sauvegardés les fichiers d'analyse?Quel système ou quelle méthode de codage sera utilisé pour l'analyse?Quelles mesures d'assurance de la qualité seront mises en oeuvre pour garantir l'exactitude et l'intégrité des données?

ANALYSE DES DONNÉES

COLLECTE DE DONNÉES

Quelles données pourront être partagées à la fin de l'étude?Qui sont les utilisateurs ou bénéficiaires probables de vos données?Décrivez les restrictions, le cas échéant.Où allez-vous partager les données?S'il y a des données protégées, comment on pourra y accéder?Quelle licence attribuerez-vous aux données?

Indiquez les ressources financières nécessaires pour le projet.Indiquez les personnes-ressources du projet.Qui aura accès à vos données?

RESPONSABILITÉS ET RESSOURCES

PARTAGE DES DONNÉES

Avez-vous prévu le consentement éclairé?Qui détient la propriété intellectuelle sur les données?Quelles contraintes éthiques ou juridiques s'appliquent à vos données?Quelles mesure seont prises pour éviter la divulgation des informations personnelles?

Quels renseignements permettront la réutilisation et l'interprétation des données?Quels normes de métadonnées seront utilisées?Quelle est la population cible de l'étude?Comment la population est-elle échantillonnée?La population est-elle pondérée?Utiliserez-vous des acronymes ou abréviations?

Quel espace de stockage est nécessaire?Où seront stockées les données pendant la phase de collecte?Où seront stockées les données pendant la phase d'analyse?Comment seront protégées les données sensibles?Quelles conventions de nomenclature des fichiers seront utilisées?

Où seront conservées les données après le projet?Qui sera responsable de la gestion des données après l'étude?Prévoyez-vous une conversion des fichiers vers des formats pérennes?Combien de temps les données seront-elles conservées?Quelles mesures seront mises en place pour la destruction des données à la fin de la période de conservation?

CONFORMITÉ ÉTHIQUE ET JURIDIQUE

STOCKAGE ET SAUVEGARDE

PRÉSERVATION

DOCUMENTATION ET MÉTADONNÉES

L'intégrité des données ne se résume pas à une seule opération. Elle requiert des sauvegardes fréquentes et des vérifications périodiques, un chiffrement des données, éventuellement du versionnage, des conversions et des procédures de récupération. La sécurité des données est un processus à long terme !

La sécurité des données est le fondement de tout projet de recherche. Elle implique de la planification en termes d'infrastructure (support de conservation), de ressources humaines (gestion des accès, formation des utilisateurs) et financières (coûts de stockage).

Sauvegarde. Gestion des fichiers.

  • Copies de sauvegarde locales et hors site.
  • Sauvegardes régulières (fréquence reliée à la quantité de données).
  • Contrôle des accès.
  • Organisation et nommage claires des fichiers pour une découverte rapide.
  • Formats pérennes.

Règles d'or

.04

Méthode de stockage

INFO

Règle du 3 - 2 - 1

ou ... Here - Near - Far

Bonnes pratiques (1)

.04

Source : MIT Libraries. (2020, 16 avril). Quick & dirty data management: the 5 things you need to be doing now!

Nommage et classification

INFO

Source: https://www.frdr-dfdr.ca/docs/fr/pr%C3%A9paration_de_vos_donn%C3%A9es/

Bonnes pratiques (2)

.04

Métadonnées, fichiers Read-me - gabarit https://guides.biblio.polymtl.ca/c.php?g=590745&p=4321359

Prévoir un manuel de codes ou un dictionnaire de données pour assurer leur bonne interprétation, ou encore un fichier Lisez-moi / Readme.

Les fichiers Lisez-moi contiennent généralement un descriptif des données et des méthodes de collecte, des informations sur les variables et les instruments de mesure (données quantitatives), sur le format de sauvegarde, sur les protocoles d'études et toute autre documentation connexe, ainsi que sur les éventuelles restrictions d'accès et de réutilisation.

voir DFDR/FRDR. Modèle de fichier LISEZ-MOI

Bonnes pratiques (3)

.04

Les algorithmes les plus populaires de hashage sont: MD5, SHA-1 et SHA-256.Le hashage est une technique d'encyprage des données; en comparant le fichier et le code qui lui a été attribué, il est possible de vérfier si les données ont été altérées (modification, perte, etc.)

  • choix de format (format ouvert versus format propriétaire)
  • métadonnées adaptées (ex. OAIS ou Open Archive Initiative System)
  • empreinte digitale (somme de contrôle ou checksum)
  • propriété intellectuelle (voir données sensibles)

Intégrité des données

L'intégrité et l'intelligibilité des données sont à risque en raison de l'obsolescence technologique. Les logiciels et les formats des fichiers évoluent constamment. Un archivage pérenne dépend de :

INFO

Bonnes pratiques (4)

.04

INFO

WAVE, AIFF, MP3, MXF, FLACMOV, MPEG-4, AVI, MXF

TIFF, PNG, JPEG, BMP, GIFSHAPEFILE (shp, dbf, shx), GeoTIFF, NetCDF, AutoCAD

Fichiers texte

Fichiers audio / vidéo

Fichiers image

Fichiers tabulaires

Rich Text Format (.rtf), PDF/A, XML, HTML, TXT (ASCII), MS Word (docx), Open Document Text (ODT)

SPSS (.sav), STATA (.dta)MS ACCESS (.mdb / accdb)SPSS Portable Format (.por)

Fichiers texte

Format recommandé

Type de fichier

Possibilité de collaborer avec les autres intervenants du projet à même la plateforme.

Ne conserve pas les différentes versions. La mise à jour des jeux de données se fait par l'entremise d'un curateur.

L'accès aux données doit être public. Une période d'embargo est acceptée. La plateforme ne supporte pas les fonctionnalités actives de gestion des données de recherche.

Technologie de transfert supportant des jeux de données volumineux (Globus File Transfer). Jusqu'à 3 To par chercheur ou par groupe de recherche.

Infrastructure de recherche numérique pancanadienne, issue d'un partenariat entre Portage, l'ABRC et Calcul Canada.

Le dépôt des données et la gestion des différentes versions se font sans intermédiaire.

Les données peuvent être publiques ou privées (partagées avec des individus ou groupes). Gestion granulaire des accès (au niveau des fichiers).

Supporte une variété de formats de fichiers. Les données peuvent être visualisées et analysées à même le navigateur.

Dataverse est une plateforme de dépôt libre, gratuite et sécuritaire.

avec

DFDR

CONSERVATION

DATAVERSE

avec

VS

CONSERVATION

Repérage, réutilisation et citation facilitées.

Data Paper

Source: https://doranum.fr/data-paper-data-journal/comment-publier-donnees-recherche/

Identification difficile des données indépendamment de l'article.

INFO

Données publiées à part

Repérage difficile des données, chances de réutilisation diminuées.

Données intégrées dans un article

.05

Publication

Politiques éditoriales

Chaque éditeur a sa politique quant à la publication des données de recherche (données brutes ou traitées, logiciels, codes, algorithmes, protocoles, etc.)

INFO

Auteurs ou contributeurs?

La taxonomie CRediT (Contributor Roles Taxonomy) permet d'identifier les rôles et d'assurer la reconnaissance de tous les contributeurs.

Le choix du dépôt aura des répercussions physiques (intégrité des données), monétaires et légales (conditions de partage, utiisation secondaire des données, confidentialité, conformité à la politique sur le libre accès, etc.).

Memento

Critères de sélection:

  • Est-ce que le répertoire garantit la préservation à long terme?
  • Accepte-t-on des données confidentielles ?
  • Quel est le coût d'entreposage (par dataset ou GB) ?
  • Quel est le lieu physique des serveurs ?
  • Y a-t-il une licence par défaut ?
  • Peut-on contrôler les accès au niveau de fichiers ou de la collection ?
  • Le répertoire est-il certifié ?

.06

Options de dépôt

INFO

https://www.nature.com/sdata/policies/repositories

ANNUAIRES

ROAR (Registry of Open Access Repositories)

Open DOAR (Directory of Open Access Repositories)

OAD (Open Access Directory / Data Repositories)

re3data (Registry of Research Data Repository)

Dépôts disciplinaires

Dépôts multidisciplinaires

Dépôts institutionnels

Dépôts fournis par éditeurs

Dépôts thématiques

Open DOAR https://v2.sherpa.ac.uk/opendoar/

INFO

Source: http://www.science.gc.ca/eic/site/063.nsf/fra/h_F6765465.html

Politique sur le libre accès, 2015

Paternité des résultatsDroits de réutilisationChoix du type de publicationPublication des résultats négatifs

Tiré de : IRSC. Éthique en recherche: une aproche fondée sur le cycle de vie scientifique (2018)

Sélection équitable des participants

Représentation adéquate de sexe et de genre

Protection en matière de biosécuritéReproductibilité

.07

Considérations éthiques

INFO

Tenue des dossiers : Conserver des dossiers complets et exacts pour les données, les méthodes et les résultats, y compris les graphiques et les images, conformément à l’entente de financement applicable, aux politiques de l’établissement, aux lois et aux règlements, ainsi qu’aux normes professionnelles ou disciplinaires, de façon à permettre la vérification ou la reproduction des travaux.

Chap. 9Recherche impliquant les Premières Nations, les Inuits ou les Métis du Canada : respect des coutumes et des codes de pratique communautaires.

Chap. 5Confidentialité : obligation de protéger l'information contre l'accès, l'utilisation, la divulgation et la modification non autorisés, d'une part, et contre la perte et le vol, d'autre part.Respect de la vie privée : attention aux renseignements identificatoires ou personnels (ex. âge, ethnicité, formation scolaire, religion, historique médical ou professionnel, statut social) !

Chap. 3Consentement libre, éclairé et continu des participants.

Énoncé de politique des trois conseils : Éthique de la recherche avec des êtres humains - EPTC 2 (2018)

Politique d'éthique de la recherche avec des êtres humains de l'UQO [dernière modification 9 février 2021]

Cadre de référence des trois organismes sur la conduite responsable de la recherche (2016)

La « possession » est un principe [...] qui définit la relation qui existe entre un peuple et l’information le concernant. Elle fait référence au contrôle physique des données. [C']est le mécanisme permettant de faire valoir et de protéger la propriété.

« Propriété » : une collectivité ou un groupe est collectivement propriétaire de l’information, à l’instar d’un individu qui est naturellement propriétaire de ses renseignements personnels.

« Accès » affirme que, quel que soit l’endroit où se trouvent des renseignements et données concernant les Premières Nations et leurs collectivités, celles-ci doivent y avoir accès. Ce principe confirme également le droit des collectivités et des organisations des Premières Nations de prendre des décisions concernant l’accès à leur information collective et la gestion de cet accès.

« Contrôle » exprime que les Premières Nations, leurs collectivités et les organismes qui les représentent ont le droit d’exiger le contrôle de l’intégralité de la recherche et des processus de gestion de l’information les concernant. Le contrôle de la recherche peut comprendre toutes les étapes d’un projet, du début à la fin.

LOI CANADIENNE DU DROIT D'AUTEUR

Art. 56 Le nom d'une personne physique n'est pas un renseignement personnel, sauf lorsqu'il est mentionné avec un autre renseignement la concernant ou lorsque sa seule mention révèlerait un renseignement personnel concernant une personne.

Art. 54 Sont personnels les renseignements qui concernent une personne physique et permettent de l'identifier.

Art. 53 Les renseignements personnels sont confidentiels, sauf si la personne concernée consente à leur divulgation.

LOI SUR L'ACCÈS AUX DOCUMENTS DES ORGANISMES PUBLICS ET SUR LA PROTECTION DES RENSEIGNEMENTS PERSONNELS

Renseignements personnels

Pas de propriété matérielle, mais plutôt gestion fiduciaire (ex. chercheur - institution - patient).Les gestionnaires (gardiens) contrôlent l'accès et le partage aux données.

Les données de recherche sont considérées des biens publics non-exclusifs et non-rivaux.Leur gestion se fait au bénéfice de tous.

On ne protège pas les données brutes ou factuelles non interprétées, mais bien les compilations / oeuvres de l'esprit qui font preuve de talent et du jugement!

Propriété des données

INFO

gdr@uqo.ca

Équipe GDR à l'UQO

Un groupe de travail institutionnel a été créé en 2019 avec l'objectif de cibler les intervenants, de préciser les rôles et responsabilités de chaque service concerné, enfin d'amorcer une concertation entre tous ces acteurs.Stratégie institutionnelle: à venir!Accompagnement à l'utilisation de Dataverse et de l'Assistant PGD.Présentations aux professeurs et chercheurs sur demande.

Envoyez vos questions et commentaires à:

Consultez la page consacrée à la gestion des données de recherche sur le site web de la bibliothèque

.09

Support

  • DORANum. Données de la recherche. Apprentissage numérique. https://doranum.fr/
  • Portage. Créer un plan de gestion des données efficace [guide sommaire].
  • Portage. Options de dépôt au Canada: un guide de Portage.
  • Portage. Ressources de formation de Portage. https://portagenetwork.ca/fr/outils-et-ressources/ressources-de-formation-de-portage/?cn-reloaded=1
  • Michener, K. M. (2015). Ten Simple Rules for Creating a Good Data Management Plan. PLoS Comput Biol 11(10): e1004525. https://doi.org/10.1371/journal.pcbi.1004525
  • Scassa, T. (2018). Data Ownership. CIGI Papers, no. 187. https://www.cigionline.org/sites/default/files/documents/Paper%20no.187_2.pdf
  • UK Data Service. Prepare and Manage Data. https://www.ukdataservice.ac.uk/manage-data.aspx

DPC (Digital Preservation Coalition). Digital Preservation Handbook.

.08

Ressources

Questions ?