Want to create interactive content? It’s easy in Genially!

Get started free

MBC-7-M4-R1

CEV PUCE

Created on July 27, 2021

Start designing with a free template

Discover more than 1500 professional designs like these:

Memories Presentation

Pechakucha Presentation

Decades Presentation

Color and Shapes Presentation

Historical Presentation

To the Moon Presentation

Projection Presentation

Transcript

Genómica

Validación y pulida del ensamblado

Validación del ensamblado

Es la utilización del conocimiento biológico para evaluar la calidad del ensamblado del genoma.La evidencia experimental directa:​

  • Mapeo de las lecturas a un genoma de referencia.​
  • Primer walking en algunos segmentos del genoma.​
  • Tamaño del genoma y contenido de GC
La evidencia experimental indirecta:​
  • Estructura génica.​
  • Repetidos.​
  • Estructura cromosómica, centrómeros, telómeros.​
  • Genomas cercanos.

Tipos de error en el ensamblado

Tomada de The Genome Analysis Center, Bernardo J. Clavijo​

La evidencia más directa del ensamblado de un genoma son las lecturas​

Entonces se puede evaluar la calidad del ensamblado cuando se tiene genoma de referencia​ al alinear las lecturas al genoma.

Evidencia experimental directa: Tamaño del genoma

Basado en la distribución de los kmers​

  1. ​Convertir la profundidad de las lecturas en​
Profundidad de los kmers.

2. El tamaño total del genoma secuenciado se​. Obtiene dividiendo el total de bases entre la ​Profundidad de las lecturas.

Software para estimar el tamaño del genoma: ErrorCorrectReads.pl

https://github.com/JinfengChen/allpath_ec/blob/master/ErrorCorrectReads_Assembly.pl

http://software.broadinstitute.org/allpaths-lg/blog/?p=559​

http://software.broadinstitute.org/allpaths-lg/blog/?p=559​

Herramientas de pulida de ensamblados

  • Alineamiento: Minimap2 (lecturas largas); bwa para lecturas cortas.​
  • Arrow: Pulida de lecturas de PacBio.​
  • Nanopolish: Pulida de lecturas de nanopore.​
  • Pilon: Pulida de lecturas de Illumina (Se puede usar para PacBio y Nanopore).​
Algunos programas de ensamblado incluyen el proceso de pulida

Evaluación de los ensamblados: Espacio génico con BUSCO

¿Qué linajes de BUSCO existen?​ ​ Artópodos vertebrados Fungi Bacteria​ Metazoos Plantas BUSCO set de genes:​ Presentes en al menos 90% de las especies en cada linaje.

https://busco.ezlab.org/busco_userguide.html

Referencias

Li H. (2018). Minimap2: pairwise alignment for nucleotide sequences. Bioinformatics (Oxford, England), 34(18), 3094–3100. https://doi.org/10.1093/bioinformatics/bty191

Walker, B. J., Abeel, T., Shea, T., Priest, M., Abouelliel, A., Sakthikumar, S., Cuomo, C. A., Zeng, Q., Wortman, J., Young, S. K., & Earl, A. M. (2014). Pilon: an integrated tool for comprehensive microbial variant detection and genome assembly improvement. PloS one, 9(11), e112963. https://doi.org/10.1371/journal.pone.0112963

Korhonen, P. K., Hall, R. S., Young, N. D., & Gasser, R. B. (2019). Common workflow language (CWL)-based software pipeline for de novo genome assembly from long- and short-read data. GigaScience, 8(4), giz014. https://doi.org/10.1093/gigascience/giz014

Li, H., & Durbin, R. (2009). Fast and accurate short read alignment with Burrows-Wheeler transform. Bioinformatics (Oxford, England), 25(14), 1754–1760. https://doi.org/10.1093/bioinformatics/btp324

Hu, K., Huang, N., Zou, Y., Liao, X., & Wang, J. (2021). MultiNanopolish: Refined grouping method for reducing redundant calculations in nanopolish. Bioinformatics (Oxford, England), btab078. Advance online publication. https://doi.org/10.1093/bioinformatics/btab078