Images et icônes générées par IA
Les entrepôts de confiance adaptés aux données multi-omics
Sélectionnés selon des critères de confiance pour vous guider dans le choix d’une solution de dépôt adaptée.
Commencer
Publié le : 13/04/2026
Face aux exigences croissantes d’ouverture des données et au respect des principes FAIR, le Collège des données de la recherche du Comité pour la science ouverte a conduit une démarche rigoureuse pour identifier des entrepôts thématiques de confiance à la demande du MESRE. À partir de 8 critères d’exclusion, une liste d'entrepôts a été établie, couvrant six grands domaines scientifiques, dont 13 en biologie et 4 dédiés aux données multi-omics.
Liste des critères
En savoir plus
Ces 4 entrepôts vous sont présentés à travers des fiches accessibles en cliquant sur les logos ci-dessous
EGA
ENA
GnpIs
ArrayExpress
Modération
ArrayExpress
Champ disciplinaire : Génomique
Pérennité
Discipline : Biologie
Institution porteuse : EMBL (Royaume Uni)
Identifiant pérenne fourni : Identifiant interne, DOI sur demande
Données acceptées
Schéma de métadonnées : MIAME "Minimum Information About a Microarray Experiment"
Array est une collection de Biostudies. Le dépôt de données génétiques fonctionnelles doit obligatoirement se faire via Array avant de les indexer dans BioStudies.
Embargo
Reconnu comme entrepôt thématique de confiance par le CoSo.
Attention ! Pour les données sensibles où il existe un risque d'identification des individus, il est recommandé d'utiliser les services du European Genome-phenome Archive (EGA).
Limite de volume
Support
Institution porteuse
Cliquer sur les flèches pour parcourir les différentes fiches entrepôts
Contact
Site officiel
Modération
European genome-phenome archive (EGA)
Champ disciplinaire : Génomique
Pérennité
Discipline : Biologie
Institutions porteuses : EMBL (Royaume Uni) & CRG (Espagne)
Données acceptées
Identifiant pérenne fourni : Identifiant interne (EGAS)
Schéma de métadonnées : basé sur XML, JSON et celui de l'entrepôt ENA (European Nucleotide Archive)
L'entrepôt recommande le recours à des vocabulaires contôlés (Experimental Factor Ontology Database) pour décrire les données de phénotypes.
Embargo
Il est recommandé pour les données potentiellement réidentifiables et nécessitant un contrôle d'accès. Toute soumission requiert l'utilisation d'un outil de cryptage (crypt4gh).
Limite de volume
EMBL
CRG
Support
Cliquer sur les flèches pour parcourir les différentes fiches entrepôts
Institutions porteuses
Contact
Site officiel
Modération
Pérennité
European Nucleotide Archive
Champs disciplinaires : Biologie moléculaire, génomique
Données acceptées
Discipline : Biologie
Institution porteuse : EMBL-EBI (Royaume Uni)
Identifiant pérenne fourni : Identifiant interne
Embargo
Schéma de métadonnées : MIxS "Minimum Information about any (x) Sequence"
Limite de volume
Support
Cliquer sur les flèches pour parcourir les différentes fiches entrepôts
Institution porteuse
Site officiel
Modération
Genetic and Genomic Information System (GnpIS)
Pérennité
Champs disciplinaires : Génétique, génomique
Discipline : Biologie
Données acceptées
Institution porteuse : INRAE Plant Biology and Breeding department (France)
Embargo
Identifiant pérenne fourni : DOI
Données hébergées en France, entrepôt certifié ISO 9001
Limite de volume
Support
Cliquer sur les flèches pour parcourir les différentes fiches entrepôts
Institution porteuse
Contact
Site officiel
Plus de ressources sur :
Des commentaires, des questions, des suggestions ? Écrivez-nous !
Recommencer
Modération
- Automatique et humaine.
- Le dépôt s'effectue via l'outil Annotare.
- Des contrôles supplémentaires d'intégrité sont opérés pour les données brutes de séquençage (fastq.gz) avant l'attribution d'un numéro d'accès au jeu de données.
Données acceptées :
- Séquences nucléotidiques
- Données brutes et annotation
Embargo
Il existe plusieurs niveaux de disponibilité et de contrôle d'accès aux données.Voir
Adresse :
INRAE URGICentre de Versailles, bâtiment 18Route de Saint Cyr78026 VersaillesFRANCE
Tél :
+33 (0)1 30 83 30 00
Fax :
+33 (0)1 30 83 34 58
Les 8 critères d’exclusion
Un entrepôt était écarté s’il présentait l’un des points suivants :
Cliquer sur les cartes pour en savoir plus
La modération garantit un niveau minimal de qualité et de complétude des métadonnées associées aux jeux de données.
Aucune garantie de pérennité de l’infrastructure
Aucun identifiant pérenne
Ce critère vise à éviter les situations où les chercheurs perdent le contrôle de leurs données au profit de plateformes commerciales.
Pour une crédibilité suffisante, l'entrepôt doit être en activité depuis 5 ans minimum.
Les identifiants préennes (DOI, ARK, Handle…) permettent de faciliter la localisation, le référencement et la citation des jeux de données.
Absence de modération des dépôts
Pratique de cession de droits par l’entrepôt
Politique tarifaire excessive pour les petits volumes
Localisation hors UE pour les données personnelles
Dépôt réservé à certaines affiliations
Atteinte potentielle à la liberté académique
Cette exigence vise à garantir la conformité avec les règles de protection des données, notamment le RGPD.
L’objectif est de ne pas pénaliser les dépôts de faible volume par des frais systématiques.
La sélection privilégie des infrastructures ouvertes et accessibles à l’ensemble de la communauté scientifique.
Les entrepôts doivent respecter les principes éthiques et préserver l’indépendance des travaux scientifiques.
Embargo
Le statut "privé" permet de transmettre le jeu de données aux évaluateurs dans le cadre du peer-reviewing.
Données acceptées :
- Données sensibles issues de recherches biomédicales.
- Séquences génétiques (formats génériques ou spécifiques).
- Puces à ADN : des fichiers de signaux bruts aux matrices.
- Phénotypes (tous formats).
Pour les autres types de données génétiques, d'autres entrepôts sont à privilégier.
Pérennité de l'infrastructure
- Entrepôt appartenant au réseau ELIXIR d'envergure internationale.
- Les données sont stockées sur BioStudies et les données brutes sont par ailleurs archivées sans limite de temps sur les serveurs de l'ENA (European Nucleotide Archive ).
Modération
- Automatique et humaine.
- Le dépôt s'effectue via l'outil Annotare.
- Des contrôles supplémentaires d'intégrité sont opérés pour les données brutes de séquençage (fastq.gz) avant l'attribution d'un numéro d'accès au jeu de données.
Données acceptées :
- Séquences nucléotidiques
- Données brutes et annotation
Modération
- Automatique et humaine.
- Tout dépôt donne lieu à un contrôle qualité documenté (File Quality Control Report).
- Délai moyen constaté entre la soumission et la publication : 1 mois.
Modération
- Les métadonnées sont modérées automatiquement via une checklist, à laquelle s'ajoute une vérification manuelle selon les cas.
- Prise de contact en direct avec les soumetteurs dans certains cas.
Données acceptées :
- Données sensibles issues de recherches biomédicales.
- Séquences génétiques (formats génériques ou spécifiques).
- Puces à ADN : des fichiers de signaux bruts aux matrices.
- Phénotypes (tous formats).
Pour les autres types de données génétiques, d'autres entrepôts sont à privilégier.
Limite de volume
Pas de limite de volume
Embargo
- 1 an avec possibilité d'extension sur justification.
- Seules les métadonnées sont rendues publiques.
- L'accès aux données est soumis à une demande d'autorisation très encadrée, nécessitant l'approbation d'un comité (Data Access Committee) désigné pour chaque jeu de données.
Embargo
Le statut "privé" permet de transmettre le jeu de données aux évaluateurs dans le cadre du peer-reviewing.
Pérennité de l'infrastructure
Cet entrepôt est adossé à l'infrastructure de l'INRAE
Limite de volume
Non indiqué mais un protocole de dépôt particulier existe pour les jeux de données comprenant plus de 1000 fichiers.
Modération
- Automatique et humaine.
- Tout dépôt donne lieu à un contrôle qualité documenté (File Quality Control Report).
- Délai moyen constaté entre la soumission et la publication : 1 mois.
Limite de volume
Volume inférieur à 48 Mo (par dépôt).
Pérennité de l'infrastructure
Cet entrepôt est adossé à l'infrastructure de l'INRAE
Modération
Modération automatisée.
Embargo
- L'accès aux données dans GnpIS peut être public (par défaut avec une licence CC-BY 4.0) ou bien limité à un groupe de personnes dont les membres reçoivent un login et un mot de passe personnel de la part de la plateforme.
- La durée d'embargo est déterminée dans les accords de consortium ou dans le formulaire de demande d’intégration de données. Le fournisseur de données s'engage à ce que l'URGI (Unit Resources Genomics-Info) puisse ouvrir publiquement les données à la fin de cet embargo.
Limite de volume
La soumission des données se fait via une "submission box" qui ne peut excéder 8To.
Pérennité de l'infrastructure
- Entrepôt appartenant au réseau ELIXIR d'envergure internationale.
- Les données sont stockées sur BioStudies et les données brutes sont par ailleurs archivées sans limite de temps sur les serveurs de l'ENA (European Nucleotide Archive ).
Limite de volume
Volume inférieur à 48 Mo (par dépôt).
Embargo
- L'accès aux données dans GnpIS peut être public (par défaut avec une licence CC-BY 4.0) ou bien limité à un groupe de personnes dont les membres reçoivent un login et un mot de passe personnel de la part de la plateforme.
- La durée d'embargo est déterminée dans les accords de consortium ou dans le formulaire de demande d’intégration de données. Le fournisseur de données s'engage à ce que l'URGI (Unit Resources Genomics-Info) puisse ouvrir publiquement les données à la fin de cet embargo.
Limite de volume
La soumission des données se fait via une "submission box" qui ne peut excéder 8To.
Pérennité de l'infrastructure
L'entrepôt existe depuis 1985.
Données acceptées :
- Données génomiques fonctionnelles à haut débit issues de puces à ADN ou de séquençage de nouvelle génération (mRNA et miRNA, génotypage par SNP, immunoprécipitation de la chromatine ChIP etc.).
- Les jeux de données comprennent généralement des annotations d'échantillons, des protocoles, des données d'analyse et des données brutes.
- L'ensemble des types d'expériences déposées dans l'entrepôts sont signalées ici :
Pérennité de l'infrastructure
- Plateforme lancée en 2008.
- Pas de durée limite, la conservation est dite "permanente".
- Les données sont répliquées sur les serveurs du Centre de calcul public de Barcelone (BSC).
- L'entrepôt fait partie du réseau international ELIXIR.
Modération
Modération automatisée.
Pérennité de l'infrastructure
L'entrepôt existe depuis 1985.
Embargo
Il existe plusieurs niveaux de disponibilité et de contrôle d'accès aux données.Voir
Données acceptées :
- Ressources génétiques, polymorphismes etdonnées de génotypage.
- Données de phénotypage.
- Données d'association.
- Cartes génétiques et QTL.
- Données de synténie.
Limite de volume
Pas de limite de volume
Embargo
- 1 an avec possibilité d'extension sur justification.
- Seules les métadonnées sont rendues publiques.
- L'accès aux données est soumis à une demande d'autorisation très encadrée, nécessitant l'approbation d'un comité (Data Access Committee) désigné pour chaque jeu de données.
Données acceptées :
- Données génomiques fonctionnelles à haut débit issues de puces à ADN ou de séquençage de nouvelle génération (mRNA et miRNA, génotypage par SNP, immunoprécipitation de la chromatine ChIP etc.).
- Les jeux de données comprennent généralement des annotations d'échantillons, des protocoles, des données d'analyse et des données brutes.
- L'ensemble des types d'expériences déposées dans l'entrepôts sont signalées ici :
Données acceptées :
- Ressources génétiques, polymorphismes etdonnées de génotypage.
- Données de phénotypage.
- Données d'association.
- Cartes génétiques et QTL.
- Données de synténie.
Modération
- Les métadonnées sont modérées automatiquement via une checklist, à laquelle s'ajoute une vérification manuelle selon les cas.
- Prise de contact en direct avec les soumetteurs dans certains cas.
Pérennité de l'infrastructure
- Plateforme lancée en 2008.
- Pas de durée limite, la conservation est dite "permanente".
- Les données sont répliquées sur les serveurs du Centre de calcul public de Barcelone (BSC).
- L'entrepôt fait partie du réseau international ELIXIR.
Les entrepôts de confiance adaptés aux données multi-omics
Formation-DoRANum
Created on March 9, 2026
Start designing with a free template
Discover more than 1500 professional designs like these:
View
Teaching Challenge: Transform Your Classroom
View
Branching Scenario Mission: Innovating for the Future
View
Branching Scenarios Challenge Mobile
View
Branching Scenario: Academic Ethics and AI Use
View
Branching Scenario: College Life
View
Strategic Decisions: Branching Scenario
View
Branching Scenarios Challenge
Explore all templates
Transcript
Images et icônes générées par IA
Les entrepôts de confiance adaptés aux données multi-omics
Sélectionnés selon des critères de confiance pour vous guider dans le choix d’une solution de dépôt adaptée.
Commencer
Publié le : 13/04/2026
Face aux exigences croissantes d’ouverture des données et au respect des principes FAIR, le Collège des données de la recherche du Comité pour la science ouverte a conduit une démarche rigoureuse pour identifier des entrepôts thématiques de confiance à la demande du MESRE. À partir de 8 critères d’exclusion, une liste d'entrepôts a été établie, couvrant six grands domaines scientifiques, dont 13 en biologie et 4 dédiés aux données multi-omics.
Liste des critères
En savoir plus
Ces 4 entrepôts vous sont présentés à travers des fiches accessibles en cliquant sur les logos ci-dessous
EGA
ENA
GnpIs
ArrayExpress
Modération
ArrayExpress
Champ disciplinaire : Génomique
Pérennité
Discipline : Biologie
Institution porteuse : EMBL (Royaume Uni)
Identifiant pérenne fourni : Identifiant interne, DOI sur demande
Données acceptées
Schéma de métadonnées : MIAME "Minimum Information About a Microarray Experiment"
Array est une collection de Biostudies. Le dépôt de données génétiques fonctionnelles doit obligatoirement se faire via Array avant de les indexer dans BioStudies.
Embargo
Reconnu comme entrepôt thématique de confiance par le CoSo.
Attention ! Pour les données sensibles où il existe un risque d'identification des individus, il est recommandé d'utiliser les services du European Genome-phenome Archive (EGA).
Limite de volume
Support
Institution porteuse
Cliquer sur les flèches pour parcourir les différentes fiches entrepôts
Contact
Site officiel
Modération
European genome-phenome archive (EGA)
Champ disciplinaire : Génomique
Pérennité
Discipline : Biologie
Institutions porteuses : EMBL (Royaume Uni) & CRG (Espagne)
Données acceptées
Identifiant pérenne fourni : Identifiant interne (EGAS)
Schéma de métadonnées : basé sur XML, JSON et celui de l'entrepôt ENA (European Nucleotide Archive)
L'entrepôt recommande le recours à des vocabulaires contôlés (Experimental Factor Ontology Database) pour décrire les données de phénotypes.
Embargo
Il est recommandé pour les données potentiellement réidentifiables et nécessitant un contrôle d'accès. Toute soumission requiert l'utilisation d'un outil de cryptage (crypt4gh).
Limite de volume
EMBL
CRG
Support
Cliquer sur les flèches pour parcourir les différentes fiches entrepôts
Institutions porteuses
Contact
Site officiel
Modération
Pérennité
European Nucleotide Archive
Champs disciplinaires : Biologie moléculaire, génomique
Données acceptées
Discipline : Biologie
Institution porteuse : EMBL-EBI (Royaume Uni)
Identifiant pérenne fourni : Identifiant interne
Embargo
Schéma de métadonnées : MIxS "Minimum Information about any (x) Sequence"
Limite de volume
Support
Cliquer sur les flèches pour parcourir les différentes fiches entrepôts
Institution porteuse
Site officiel
Modération
Genetic and Genomic Information System (GnpIS)
Pérennité
Champs disciplinaires : Génétique, génomique
Discipline : Biologie
Données acceptées
Institution porteuse : INRAE Plant Biology and Breeding department (France)
Embargo
Identifiant pérenne fourni : DOI
Données hébergées en France, entrepôt certifié ISO 9001
Limite de volume
Support
Cliquer sur les flèches pour parcourir les différentes fiches entrepôts
Institution porteuse
Contact
Site officiel
Plus de ressources sur :
Des commentaires, des questions, des suggestions ? Écrivez-nous !
Recommencer
Modération
Données acceptées :
Embargo
Il existe plusieurs niveaux de disponibilité et de contrôle d'accès aux données.Voir
Adresse :
INRAE URGICentre de Versailles, bâtiment 18Route de Saint Cyr78026 VersaillesFRANCE
Tél :
+33 (0)1 30 83 30 00
Fax :
+33 (0)1 30 83 34 58
Les 8 critères d’exclusion
Un entrepôt était écarté s’il présentait l’un des points suivants :
Cliquer sur les cartes pour en savoir plus
La modération garantit un niveau minimal de qualité et de complétude des métadonnées associées aux jeux de données.
Aucune garantie de pérennité de l’infrastructure
Aucun identifiant pérenne
Ce critère vise à éviter les situations où les chercheurs perdent le contrôle de leurs données au profit de plateformes commerciales.
Pour une crédibilité suffisante, l'entrepôt doit être en activité depuis 5 ans minimum.
Les identifiants préennes (DOI, ARK, Handle…) permettent de faciliter la localisation, le référencement et la citation des jeux de données.
Absence de modération des dépôts
Pratique de cession de droits par l’entrepôt
Politique tarifaire excessive pour les petits volumes
Localisation hors UE pour les données personnelles
Dépôt réservé à certaines affiliations
Atteinte potentielle à la liberté académique
Cette exigence vise à garantir la conformité avec les règles de protection des données, notamment le RGPD.
L’objectif est de ne pas pénaliser les dépôts de faible volume par des frais systématiques.
La sélection privilégie des infrastructures ouvertes et accessibles à l’ensemble de la communauté scientifique.
Les entrepôts doivent respecter les principes éthiques et préserver l’indépendance des travaux scientifiques.
Embargo
Le statut "privé" permet de transmettre le jeu de données aux évaluateurs dans le cadre du peer-reviewing.
Données acceptées :
Pour les autres types de données génétiques, d'autres entrepôts sont à privilégier.
Pérennité de l'infrastructure
Modération
Données acceptées :
Modération
Modération
Données acceptées :
Pour les autres types de données génétiques, d'autres entrepôts sont à privilégier.
Limite de volume
Pas de limite de volume
Embargo
Embargo
Le statut "privé" permet de transmettre le jeu de données aux évaluateurs dans le cadre du peer-reviewing.
Pérennité de l'infrastructure
Cet entrepôt est adossé à l'infrastructure de l'INRAE
Limite de volume
Non indiqué mais un protocole de dépôt particulier existe pour les jeux de données comprenant plus de 1000 fichiers.
Modération
Limite de volume
Volume inférieur à 48 Mo (par dépôt).
Pérennité de l'infrastructure
Cet entrepôt est adossé à l'infrastructure de l'INRAE
Modération
Modération automatisée.
Embargo
Limite de volume
La soumission des données se fait via une "submission box" qui ne peut excéder 8To.
Pérennité de l'infrastructure
Limite de volume
Volume inférieur à 48 Mo (par dépôt).
Embargo
Limite de volume
La soumission des données se fait via une "submission box" qui ne peut excéder 8To.
Pérennité de l'infrastructure
L'entrepôt existe depuis 1985.
Données acceptées :
Pérennité de l'infrastructure
Modération
Modération automatisée.
Pérennité de l'infrastructure
L'entrepôt existe depuis 1985.
Embargo
Il existe plusieurs niveaux de disponibilité et de contrôle d'accès aux données.Voir
Données acceptées :
Limite de volume
Pas de limite de volume
Embargo
Données acceptées :
Données acceptées :
Modération
Pérennité de l'infrastructure