Genómica
Bases de la anotación del genoma
EMPEZAR
Anotación del genoma
La anotación del genoma es el proceso por el cual se le adjudica información biológica a las secuencias de ADN.Las bases para esta asignación son las siguientes:
- Identificar las fracciones del genoma que no codifican para proteínas.
- Identificar los elementos genéticos en el genoma (principalmente la predicción de genes).
- Adjuntar la información biológica disponible a estos elementos.
Formatos de los archivos de anotación
FASTA: Almacena secuencias de ADN y proteína donde se divide cada secuencia por un separador “>”
en el encabezado, seguido de la secuencia en cuestión.
Hosseini et al., 2016
Formatos de los archivos de anotación
GFF3: Es el formato general de características, llamado así por “gene-finding format”. Se utiliza para describir genes y otras características de las secuencias de ADN o ARN.
Formatos de los archivos de anotación
http://resources.qiagenbioinformatics.com/manuals/clcgenomicsworkbench/950/index.php?manual=GFF3_format.html
Predicción de genes: Anotación estructural
El primer paso para identificar qué secuencias codifican para proteínas es encontrar cuáles tienen estructuras. A esto se le llama “Anotación estructural” .
1. La idea es identificar y localizar los Marcos abiertos de lectura, motivos de regulación,etc
tRNA prediction
Predicción de RNAs estructurales:
- Aragorn
- Puedes utilizar códigos genéticos para procariotes o eucariotes
- Se puede seleccionar la topología del genoma
Anotación funcional
- Búsqueda de similitud de secuencia mediante la descripción de función bioquímica y biológica.
- Predicción de cluster de metabolitos secundarios
- Buscar ontólogos
BLAST: Es la herramienta más utilizada para la búsqueda de similitud de secuencia.
Referencias
Hosseini, M., Pratas, D., & Pinho, A. (2016). A Survey on Data Compression Methods for Biological Sequences. Information, 7(4), 56. MDPI AG. Retrieved from http://dx.doi.org/10.3390/info7040056
MBC-7-M5-R1
PUCE
Created on July 27, 2021
Start designing with a free template
Discover more than 1500 professional designs like these:
View
Momentum: Employee Introduction Presentation
View
Momentum: Onboarding Presentation
View
Startup Presentation
View
Black and White Presentation
View
Marketing Presentation
View
Dynamic Visual Presentation
View
Corporate Christmas Presentation
Explore all templates
Transcript
Genómica
Bases de la anotación del genoma
EMPEZAR
Anotación del genoma
La anotación del genoma es el proceso por el cual se le adjudica información biológica a las secuencias de ADN.Las bases para esta asignación son las siguientes:
Formatos de los archivos de anotación
FASTA: Almacena secuencias de ADN y proteína donde se divide cada secuencia por un separador “>” en el encabezado, seguido de la secuencia en cuestión.
Hosseini et al., 2016
Formatos de los archivos de anotación
GFF3: Es el formato general de características, llamado así por “gene-finding format”. Se utiliza para describir genes y otras características de las secuencias de ADN o ARN.
Formatos de los archivos de anotación
http://resources.qiagenbioinformatics.com/manuals/clcgenomicsworkbench/950/index.php?manual=GFF3_format.html
Predicción de genes: Anotación estructural
El primer paso para identificar qué secuencias codifican para proteínas es encontrar cuáles tienen estructuras. A esto se le llama “Anotación estructural” .
1. La idea es identificar y localizar los Marcos abiertos de lectura, motivos de regulación,etc
tRNA prediction
Predicción de RNAs estructurales:
Anotación funcional
- Búsqueda de similitud de secuencia mediante la descripción de función bioquímica y biológica.
- Predicción de cluster de metabolitos secundarios
- Buscar ontólogos
BLAST: Es la herramienta más utilizada para la búsqueda de similitud de secuencia.Referencias
Hosseini, M., Pratas, D., & Pinho, A. (2016). A Survey on Data Compression Methods for Biological Sequences. Information, 7(4), 56. MDPI AG. Retrieved from http://dx.doi.org/10.3390/info7040056