Want to create interactive content? It’s easy in Genially!

Get started free

Prod-CW-création collecte description des données

Formation-DoRANum

Created on February 1, 2021

Start designing with a free template

Discover more than 1500 professional designs like these:

Practical Microsite

Essential Microsite

Akihabara Microsite

Essential CV

Akihabara Resume

3D Corporate Reporting

Corporate CV

Transcript

Création, collecte, traitement et description des données

Cycle de vie des données

Diversité des données de la recherche

Préparation et documentation des données

Les logiciels

VOIR

Cycle de vie des données

Diversité des données de la recherche

Préparation et documentation des données

Les logiciels

cycle de vie des données

La création/collecte des données et leur traitement sont deux phases successives qui interviennent au tout début du projet de recherche et au début du cycle de vie des données.

Cycle de vie des données

Diversité des données de la recherche

Préparation et documentation des données

Les logiciels

Diversité des données de la recherche

Selon le projet, les données de la recherche peuvent être :

  • Produites ou recueillies : ce sont les données créées, élaborées, générées lors d'activités de recherche (collectes sur le terrain, observations, mesures…).
  • Préexistantes : ce sont des données déjà existantes (provenant de corpus, d'archives…) qui sont utilisées pour le projet. Les données utilisées peuvent avoir été recueillies initialement dans un autre contexte que celui de la recherche mais elles sont utilisées comme données de recherche dans le cadre du projet.

Nature

Support

Type

Les données de recherche peuvent être de différente nature et de tout type, contenues dans divers supports, selon leur contexte de création (capture ou production), leur exploitation, leur analyse et les traitements qu’elles subissent.

Survolez pour voir le détail

Cycle de vie des données

Diversité des données de la recherche

Préparation et documentation des données

Les logiciels

Préparation et documentation des données 1/2

Cliquer pour voir le détail

Il est impératif de bien préparer et documenter ses données afin d’optimiser le stockage, le partage, l’archivage et la réutilisation. Il est recommandé de réaliser ce travail de documentation dès l'étape de collecte/création des données. Dans le Plan de gestion de données (PGD), il faut indiquer de manière précise quelles méthodes sont utilisées pour recueillir ou produire les données.

Données préexistantes

données produites

Attention aux données sensibles, personnelles ou confidentielles : prendre les précautions nécessaires afin de respecter les règles juridiques et éthiques en vigueur.

Cycle de vie des données

Diversité des données de la recherche

Préparation et documentation des données

Les logiciels

Préparation et documentation des données 2/2

Il est important de bien documenter les données au fur et à mesure de l'étape de traitement des données, de manière à ce qu’elles soient faciles à trouver et réutilisables. Ces informations devront apparaitre dans les métadonnées et/ou dans un fichier Readme. Elles sont indispensables pour que d’autres chercheurs puissent reproduire les résultats (reproductibilité et réplicabilité).

Reproductibilité
Réplicabilité

Cliquer pour voir le détail

Cycle de vie des données

Diversité des données de la recherche

Préparation et documentation des données

Les logiciels

Les logiciels

Dans de nombreux projets de recherche, des logiciels sont utilisés, et/ou créés, et/ou adaptés. Cette utilisation de logiciels peut intervenir à toutes les étapes de la recherche, dans tous les domaines scientifiques, et se révèle essentielle. Pour reproduire une expérience, il est indispensable de connaître avec exactitude la version du logiciel employée.

Qu'est-ce qu'un code source ?

Le logiciel joue dans la recherche un triple rôle :

En fonction du projet, il s'agira donc de renseigner la version du logiciel utilisée ou de communiquer ses codes sources.

Cliquer pour voir le détail

Cliquer pour voir le détail

Il est donc fortement recommandé de documenter soigneusement tout ce qui concerne les logiciels et codes sources utilisés dans le cadre du projet en parallèle du travail sur les données.

La reproductibilité

C'est la capacité, par une équipe différente, de reproduire une expérience, sans se fier au dispositif expérimental et aux codes logiciels développés par l’équipe d’origine.

La réplicabilité

C'est la capacité, par une équipe différente, de reproduire une expérience en ré-utilisant le même dispositif expérimental décrit (y compris les codes logiciels).

Dans le cas de données collectées (préexistantes)

Indiquer :

  • Leur provenance (corpus, archives…),
  • Sur quels critères elles ont été sélectionnées
  • Les conditions de réutilisations préexistantes de ces données.
Dans le cas de données produites

Indiquer :

  • Le contexte de création,
  • Les méthodes utilisées
  • Les protocoles suivis ou établis,
  • Les contrôles qualité mis en place.

Le logiciel sert d’outil dans de nombreux domaines, en traitant efficacement divers types de données pour construire et tester des modèles visant à étayer ou invalider des hypothèses

Le logiciel peut constituer en lui-même un résultat de recherche, en tant que preuve d’existence d’une solution algorithmique efficace à un problème donné.

Le logiciel peut être lui-même objet de recherche. En particulier, la communauté scientifique s’intéresse aux modes de développement des logiciels et à la preuve de leurs propriétés, en lien notamment avec la transparence et la confiance dans les traitements informatisés.