Want to create interactive content? It’s easy in Genially!
MBC-1-M6-R1
CEV PUCE
Created on August 24, 2021
Start designing with a free template
Discover more than 1500 professional designs like these:
View
Practical Presentation
View
Smart Presentation
View
Essential Presentation
View
Akihabara Presentation
View
Pastel Color Presentation
View
Nature Presentation
View
Higher Education Presentation
Transcript
Biología Computacional
Introducción a las bases de datos biológicas.
La era genómica
Crecimiento exponencial de los datos biológicos y del poder de computación
Ley de Moore
GenBank
A lo largo de la historia del hardware informático, el número de transistores en un circuito integrado denso se duplica aproximadamente cada 18 a 24 meses. Fuente: Moore, Gordon E. (1965) Incorporación de más componentes en circuitos integrados. Electrónica: 114-117 (con ajustes posteriores).
“Desde 1982 hasta el presente, la cantidad de bases en GenBank se duplicó aproximadamente cada 18 meses ".
Fuente: www.ncbi.nlm.nih.gov/genbank/statistics
Datos biológicos que incrementan exponencialmente
Bases de datos biológicas de nucleótidos
International Nucleotide Sequence Database Collaboration (INSDC) http://www.insdc.org/ Es una iniciativa fundamental de datos que opera entre DDBJ, EMBL-EBI y NCBI. INSDC cubre el espectro de lecturas sin procesar de datos, desde alineaciones y ensamblajes hasta anotaciones funcionales, enriquecidas con información contextual relacionada con muestras y configuraciones experimentales.
Bases de datos biológicas de nucleótidos
National Center for Biotechnology Information (NCBI)European Bioinformatics Institute (EMBL-EBI) DDBJ
National Center for Biotechnology Information (NCBI)
NCBI https://www.ncbi.nlm.nih.gov
- PubMed (más de 30 millones de citas), PubMed Central (más de 6,4 millones de artículos de texto completo de más de 10,000 revistas), libros de texto, u otro material de referencia.
- GenBank, RefSeq, CDD, MMDB y otras bases de datos de secuencia y estructura.
- Casi 10 billones de pares de bases (10 terabases) de más de 674.000 especies.
- Navegadores y datos genómicos procariotas (más de 267.000 genomas microbianos (casi 20.000
- completo), más de 41.000 virus, más de 23.000 plásmidos y secuencias adicionales).
- Navegadores y datos genómicos eucariotas (más de 12.000 genomas eucariotas y casi
- 17.000 orgánulos).
- BLAST, Primer-BLAST, Smart-BLAST, Ig-BLAST, MOLE-BLAST, búsqueda de CD, CDART y VecScreen, herramientas de búsqueda, herramientas de alineación global y múltiple.
European Bioinformatics Institute (EMBL-EBI)
EMBL-EBI https://www.ebi.ac.uk/ 21 repositorios de datos (Array Express, BioModels, BioSamples, BioStudies, ChEBI, DGVa, EFO, EGA, EMPIAR, ENA, EVA, GO, GWAS Catalog, IntAct, IntEnz, MetaboLights, Metagenomics, OneDep, PRIDE, UniProt SPIN, UniProt). 390 Petabytes de datos crudos en almacenamiento. 82 millones de web requests en un día promedio.
European Bioinformatics Institute (EMBL-EBI)
DNA Data Bank of Japan (DDBJ)
DDBJ https://www.ddbj.nig.ac.jp/index-e.html 95,929,186 secuencias contribuidas al INSDC hasta el 2021-06. 310,287 secuencias de HTC. Representando el 53% del INSDC. La mayor parte de las contribuciones son de estudios en humanos.
Referencias
Jovanovic, O. (2020). Introduction to Computational & Quantitative Biology. Department of Microbiology & Immunology. https://microbiology.columbia.edu/icqb
Cook, C. E., Bergman, M. T., Cochrane, G., Apweiler, R., & Birney, E. (2018). The European Bioinformatics Institute in 2017: Data coordination and integration. Nucleic Acids Research, 46(D1), D21–D29. https://doi.org/10.1093/nar/gkx1154
