Want to create interactive content? It’s easy in Genially!

Get started free

Les entrepôts de confiance adaptés aux données multi-omics

Formation-DoRANum

Created on March 9, 2026

Start designing with a free template

Discover more than 1500 professional designs like these:

Teaching Challenge: Transform Your Classroom

Branching Scenario Mission: Innovating for the Future

Branching Scenarios Challenge Mobile

Branching Scenario: Academic Ethics and AI Use

Branching Scenario: College Life

Strategic Decisions: Branching Scenario

Branching Scenarios Challenge

Transcript

Images et icônes générées par IA

Les entrepôts de confiance adaptés aux données multi-omics

Sélectionnés selon des critères de confiance pour vous guider dans le choix d’une solution de dépôt adaptée.

Commencer

Publié le : 13/04/2026

Face aux exigences croissantes d’ouverture des données et au respect des principes FAIR, le Collège des données de la recherche du Comité pour la science ouverte a conduit une démarche rigoureuse pour identifier des entrepôts thématiques de confiance à la demande du MESRE. À partir de 8 critères d’exclusion, une liste d'entrepôts a été établie, couvrant six grands domaines scientifiques, dont 13 en biologie et 4 dédiés aux données multi-omics.

Liste des critères

En savoir plus

Ces 4 entrepôts vous sont présentés à travers des fiches accessibles en cliquant sur les logos ci-dessous

EGA

ENA

GnpIs

ArrayExpress

Modération

ArrayExpress

Champ disciplinaire : Génomique

Pérennité

Discipline : Biologie

Institution porteuse : EMBL (Royaume Uni)

Identifiant pérenne fourni : Identifiant interne, DOI sur demande

Données acceptées

Schéma de métadonnées : MIAME "Minimum Information About a Microarray Experiment"

Array est une collection de Biostudies. Le dépôt de données génétiques fonctionnelles doit obligatoirement se faire via Array avant de les indexer dans BioStudies.

Embargo

Reconnu comme entrepôt thématique de confiance par le CoSo.

Attention ! Pour les données sensibles où il existe un risque d'identification des individus, il est recommandé d'utiliser les services du European Genome-phenome Archive (EGA).

Limite de volume

Support

Institution porteuse

Cliquer sur les flèches pour parcourir les différentes fiches entrepôts

Contact

Site officiel

Modération

European genome-phenome archive (EGA)

Champ disciplinaire : Génomique

Pérennité

Discipline : Biologie

Institutions porteuses : EMBL (Royaume Uni) & CRG (Espagne)

Données acceptées

Identifiant pérenne fourni : Identifiant interne (EGAS)

Schéma de métadonnées : basé sur XML, JSON et celui de l'entrepôt ENA (European Nucleotide Archive)

L'entrepôt recommande le recours à des vocabulaires contôlés (Experimental Factor Ontology Database) pour décrire les données de phénotypes.

Embargo

Il est recommandé pour les données potentiellement réidentifiables et nécessitant un contrôle d'accès. Toute soumission requiert l'utilisation d'un outil de cryptage (crypt4gh).

Limite de volume

EMBL

CRG

Support

Cliquer sur les flèches pour parcourir les différentes fiches entrepôts

Institutions porteuses

Contact

Site officiel

Modération

Pérennité

European Nucleotide Archive

Champs disciplinaires : Biologie moléculaire, génomique

Données acceptées

Discipline : Biologie

Institution porteuse : EMBL-EBI (Royaume Uni)

Identifiant pérenne fourni : Identifiant interne

Embargo

Schéma de métadonnées : MIxS "Minimum Information about any (x) Sequence"

Limite de volume

Support

Cliquer sur les flèches pour parcourir les différentes fiches entrepôts

Institution porteuse

Site officiel

Modération

Genetic and Genomic Information System (GnpIS)

Pérennité

Champs disciplinaires : Génétique, génomique

Discipline : Biologie

Données acceptées

Institution porteuse : INRAE Plant Biology and Breeding department (France)

Embargo

Identifiant pérenne fourni : DOI

Données hébergées en France, entrepôt certifié ISO 9001

Limite de volume

Support

Cliquer sur les flèches pour parcourir les différentes fiches entrepôts

Institution porteuse

Contact

Site officiel

Plus de ressources sur :

Des commentaires, des questions, des suggestions ? Écrivez-nous !

Recommencer

Modération

  • Automatique et humaine.
  • Le dépôt s'effectue via l'outil Annotare.
  • Des contrôles supplémentaires d'intégrité sont opérés pour les données brutes de séquençage (fastq.gz) avant l'attribution d'un numéro d'accès au jeu de données.

Données acceptées :

  • Séquences nucléotidiques
  • Données brutes et annotation

Embargo

Il existe plusieurs niveaux de disponibilité et de contrôle d'accès aux données.Voir

Adresse :

INRAE URGICentre de Versailles, bâtiment 18Route de Saint Cyr78026 VersaillesFRANCE

Tél :

+33 (0)1 30 83 30 00

Fax :

+33 (0)1 30 83 34 58

Les 8 critères d’exclusion

Un entrepôt était écarté s’il présentait l’un des points suivants :

Cliquer sur les cartes pour en savoir plus

La modération garantit un niveau minimal de qualité et de complétude des métadonnées associées aux jeux de données.

Aucune garantie de pérennité de l’infrastructure
Aucun identifiant pérenne

Ce critère vise à éviter les situations où les chercheurs perdent le contrôle de leurs données au profit de plateformes commerciales.

Pour une crédibilité suffisante, l'entrepôt doit être en activité depuis 5 ans minimum.

Les identifiants préennes (DOI, ARK, Handle…) permettent de faciliter la localisation, le référencement et la citation des jeux de données.

Absence de modération des dépôts
Pratique de cession de droits par l’entrepôt
Politique tarifaire excessive pour les petits volumes
Localisation hors UE pour les données personnelles
Dépôt réservé à certaines affiliations
Atteinte potentielle à la liberté académique

Cette exigence vise à garantir la conformité avec les règles de protection des données, notamment le RGPD.

L’objectif est de ne pas pénaliser les dépôts de faible volume par des frais systématiques.

La sélection privilégie des infrastructures ouvertes et accessibles à l’ensemble de la communauté scientifique.

Les entrepôts doivent respecter les principes éthiques et préserver l’indépendance des travaux scientifiques.

Embargo

Le statut "privé" permet de transmettre le jeu de données aux évaluateurs dans le cadre du peer-reviewing.

Données acceptées :

  • Données sensibles issues de recherches biomédicales.
  • Séquences génétiques (formats génériques ou spécifiques).
  • Puces à ADN : des fichiers de signaux bruts aux matrices.
  • Phénotypes (tous formats).

Pour les autres types de données génétiques, d'autres entrepôts sont à privilégier.

Pérennité de l'infrastructure

  • Entrepôt appartenant au réseau ELIXIR d'envergure internationale.
  • Les données sont stockées sur BioStudies et les données brutes sont par ailleurs archivées sans limite de temps sur les serveurs de l'ENA (European Nucleotide Archive ).

Modération

  • Automatique et humaine.
  • Le dépôt s'effectue via l'outil Annotare.
  • Des contrôles supplémentaires d'intégrité sont opérés pour les données brutes de séquençage (fastq.gz) avant l'attribution d'un numéro d'accès au jeu de données.

Données acceptées :

  • Séquences nucléotidiques
  • Données brutes et annotation

Modération

  • Automatique et humaine.
  • Tout dépôt donne lieu à un contrôle qualité documenté (File Quality Control Report).
  • Délai moyen constaté entre la soumission et la publication : 1 mois.

Modération

  • Les métadonnées sont modérées automatiquement via une checklist, à laquelle s'ajoute une vérification manuelle selon les cas.
  • Prise de contact en direct avec les soumetteurs dans certains cas.

Données acceptées :

  • Données sensibles issues de recherches biomédicales.
  • Séquences génétiques (formats génériques ou spécifiques).
  • Puces à ADN : des fichiers de signaux bruts aux matrices.
  • Phénotypes (tous formats).

Pour les autres types de données génétiques, d'autres entrepôts sont à privilégier.

Limite de volume

Pas de limite de volume

Embargo

  • 1 an avec possibilité d'extension sur justification.
  • Seules les métadonnées sont rendues publiques.
  • L'accès aux données est soumis à une demande d'autorisation très encadrée, nécessitant l'approbation d'un comité (Data Access Committee) désigné pour chaque jeu de données.

Embargo

Le statut "privé" permet de transmettre le jeu de données aux évaluateurs dans le cadre du peer-reviewing.

Pérennité de l'infrastructure

Cet entrepôt est adossé à l'infrastructure de l'INRAE

Limite de volume

Non indiqué mais un protocole de dépôt particulier existe pour les jeux de données comprenant plus de 1000 fichiers.

Modération

  • Automatique et humaine.
  • Tout dépôt donne lieu à un contrôle qualité documenté (File Quality Control Report).
  • Délai moyen constaté entre la soumission et la publication : 1 mois.

Limite de volume

Volume inférieur à 48 Mo (par dépôt).

Pérennité de l'infrastructure

Cet entrepôt est adossé à l'infrastructure de l'INRAE

Modération

Modération automatisée.

Embargo

  • L'accès aux données dans GnpIS peut être public (par défaut avec une licence CC-BY 4.0) ou bien limité à un groupe de personnes dont les membres reçoivent un login et un mot de passe personnel de la part de la plateforme.
  • La durée d'embargo est déterminée dans les accords de consortium ou dans le formulaire de demande d’intégration de données. Le fournisseur de données s'engage à ce que l'URGI (Unit Resources Genomics-Info) puisse ouvrir publiquement les données à la fin de cet embargo.

Limite de volume

La soumission des données se fait via une "submission box" qui ne peut excéder 8To.

Pérennité de l'infrastructure

  • Entrepôt appartenant au réseau ELIXIR d'envergure internationale.
  • Les données sont stockées sur BioStudies et les données brutes sont par ailleurs archivées sans limite de temps sur les serveurs de l'ENA (European Nucleotide Archive ).

Limite de volume

Volume inférieur à 48 Mo (par dépôt).

Embargo

  • L'accès aux données dans GnpIS peut être public (par défaut avec une licence CC-BY 4.0) ou bien limité à un groupe de personnes dont les membres reçoivent un login et un mot de passe personnel de la part de la plateforme.
  • La durée d'embargo est déterminée dans les accords de consortium ou dans le formulaire de demande d’intégration de données. Le fournisseur de données s'engage à ce que l'URGI (Unit Resources Genomics-Info) puisse ouvrir publiquement les données à la fin de cet embargo.

Limite de volume

La soumission des données se fait via une "submission box" qui ne peut excéder 8To.

Pérennité de l'infrastructure

L'entrepôt existe depuis 1985.

Données acceptées :

  • Données génomiques fonctionnelles à haut débit issues de puces à ADN ou de séquençage de nouvelle génération (mRNA et miRNA, génotypage par SNP, immunoprécipitation de la chromatine ChIP etc.).
  • Les jeux de données comprennent généralement des annotations d'échantillons, des protocoles, des données d'analyse et des données brutes.
  • L'ensemble des types d'expériences déposées dans l'entrepôts sont signalées ici :

Pérennité de l'infrastructure

  • Plateforme lancée en 2008.
  • Pas de durée limite, la conservation est dite "permanente".
  • Les données sont répliquées sur les serveurs du Centre de calcul public de Barcelone (BSC).
  • L'entrepôt fait partie du réseau international ELIXIR.

Modération

Modération automatisée.

Pérennité de l'infrastructure

L'entrepôt existe depuis 1985.

Embargo

Il existe plusieurs niveaux de disponibilité et de contrôle d'accès aux données.Voir

Données acceptées :

  • Ressources génétiques, polymorphismes etdonnées de génotypage.
  • Données de phénotypage.
  • Données d'association.
  • Cartes génétiques et QTL.
  • Données de synténie.

Limite de volume

Pas de limite de volume

Embargo

  • 1 an avec possibilité d'extension sur justification.
  • Seules les métadonnées sont rendues publiques.
  • L'accès aux données est soumis à une demande d'autorisation très encadrée, nécessitant l'approbation d'un comité (Data Access Committee) désigné pour chaque jeu de données.

Données acceptées :

  • Données génomiques fonctionnelles à haut débit issues de puces à ADN ou de séquençage de nouvelle génération (mRNA et miRNA, génotypage par SNP, immunoprécipitation de la chromatine ChIP etc.).
  • Les jeux de données comprennent généralement des annotations d'échantillons, des protocoles, des données d'analyse et des données brutes.
  • L'ensemble des types d'expériences déposées dans l'entrepôts sont signalées ici :

Données acceptées :

  • Ressources génétiques, polymorphismes etdonnées de génotypage.
  • Données de phénotypage.
  • Données d'association.
  • Cartes génétiques et QTL.
  • Données de synténie.

Modération

  • Les métadonnées sont modérées automatiquement via une checklist, à laquelle s'ajoute une vérification manuelle selon les cas.
  • Prise de contact en direct avec les soumetteurs dans certains cas.

Pérennité de l'infrastructure

  • Plateforme lancée en 2008.
  • Pas de durée limite, la conservation est dite "permanente".
  • Les données sont répliquées sur les serveurs du Centre de calcul public de Barcelone (BSC).
  • L'entrepôt fait partie du réseau international ELIXIR.