Want to create interactive content? It’s easy in Genially!
MBC-7-M4-R1
CEV PUCE
Created on July 27, 2021
Start designing with a free template
Discover more than 1500 professional designs like these:
View
Memories Presentation
View
Pechakucha Presentation
View
Decades Presentation
View
Color and Shapes Presentation
View
Historical Presentation
View
To the Moon Presentation
View
Projection Presentation
Transcript
Genómica
Validación y pulida del ensamblado
Validación del ensamblado
Es la utilización del conocimiento biológico para evaluar la calidad del ensamblado del genoma.La evidencia experimental directa:
- Mapeo de las lecturas a un genoma de referencia.
- Primer walking en algunos segmentos del genoma.
- Tamaño del genoma y contenido de GC
- Estructura génica.
- Repetidos.
- Estructura cromosómica, centrómeros, telómeros.
- Genomas cercanos.
Tipos de error en el ensamblado
Tomada de The Genome Analysis Center, Bernardo J. Clavijo
La evidencia más directa del ensamblado de un genoma son las lecturas
Entonces se puede evaluar la calidad del ensamblado cuando se tiene genoma de referencia al alinear las lecturas al genoma.
Evidencia experimental directa: Tamaño del genoma
Basado en la distribución de los kmers
- Convertir la profundidad de las lecturas en
2. El tamaño total del genoma secuenciado se. Obtiene dividiendo el total de bases entre la Profundidad de las lecturas.
Software para estimar el tamaño del genoma: ErrorCorrectReads.pl
https://github.com/JinfengChen/allpath_ec/blob/master/ErrorCorrectReads_Assembly.pl
http://software.broadinstitute.org/allpaths-lg/blog/?p=559
http://software.broadinstitute.org/allpaths-lg/blog/?p=559
Herramientas de pulida de ensamblados
- Alineamiento: Minimap2 (lecturas largas); bwa para lecturas cortas.
- Arrow: Pulida de lecturas de PacBio.
- Nanopolish: Pulida de lecturas de nanopore.
- Pilon: Pulida de lecturas de Illumina (Se puede usar para PacBio y Nanopore).
Evaluación de los ensamblados: Espacio génico con BUSCO
¿Qué linajes de BUSCO existen? Artópodos vertebrados Fungi Bacteria Metazoos Plantas BUSCO set de genes: Presentes en al menos 90% de las especies en cada linaje.
https://busco.ezlab.org/busco_userguide.html
Referencias
Li H. (2018). Minimap2: pairwise alignment for nucleotide sequences. Bioinformatics (Oxford, England), 34(18), 3094–3100. https://doi.org/10.1093/bioinformatics/bty191
Walker, B. J., Abeel, T., Shea, T., Priest, M., Abouelliel, A., Sakthikumar, S., Cuomo, C. A., Zeng, Q., Wortman, J., Young, S. K., & Earl, A. M. (2014). Pilon: an integrated tool for comprehensive microbial variant detection and genome assembly improvement. PloS one, 9(11), e112963. https://doi.org/10.1371/journal.pone.0112963
Korhonen, P. K., Hall, R. S., Young, N. D., & Gasser, R. B. (2019). Common workflow language (CWL)-based software pipeline for de novo genome assembly from long- and short-read data. GigaScience, 8(4), giz014. https://doi.org/10.1093/gigascience/giz014
Li, H., & Durbin, R. (2009). Fast and accurate short read alignment with Burrows-Wheeler transform. Bioinformatics (Oxford, England), 25(14), 1754–1760. https://doi.org/10.1093/bioinformatics/btp324
Hu, K., Huang, N., Zou, Y., Liao, X., & Wang, J. (2021). MultiNanopolish: Refined grouping method for reducing redundant calculations in nanopolish. Bioinformatics (Oxford, England), btab078. Advance online publication. https://doi.org/10.1093/bioinformatics/btab078
