Want to create interactive content? It’s easy in Genially!
MBC-6-M2-R2
CEV PUCE
Created on May 3, 2021
Start designing with a free template
Discover more than 1500 professional designs like these:
View
Higher Education Presentation
View
Psychedelic Presentation
View
Vaporwave presentation
View
Geniaflix Presentation
View
Vintage Mosaic Presentation
View
Modern Zen Presentation
View
Newspaper Presentation
Transcript
Algoritmos de la Biología Computacional
Conversión y análisis de PSSM.
Maestría en Economía Circular
Introducción
Las matrices de puntuación específicas de posición (PSSM):
- Son una forma flexible de representar la especificidad de las interacciones entre el factor de transcripción y el ADN. Transcription factor/DNA interactions.
- Se pueden construir sobre la base de un conjunto de sitios de unión conocidos para el factor de interés. Known bindind sites for the factor of interest.
Bases de datos de factores de transcripción
El PSSM basado en el conocimiento se puede obtener de varias bases de datos de factores de transcripción, por ejemplo:
JASPAR (Eukaryotes) http://jaspar.genereg.net/ RegulonDB (Escherichia coli K12) http://regulondb.ccg.unam.mx/ SCPD (The Promoter Database of Saccharomcyces cerevisiae) http://rulai.cshl.edu/SCPD/ Yeastract (Yeast Search for Transcriptional Regulators And Consensus Tracking) http://www.yeastract.com/ TRANSFAC (Note: the full database access requires a commercial license) http://gene-regulation.com/pub/databases.html#transfac
Matriz
La siguiente matriz de alineamiento o de conteo se obtuvo del SCPD, la base de datos de promotores de Saccharomyces cerevisiae. NO ES UNA PSSM. Se ha construido a partir de un alineamiento de 12 sitios de unión o binding sites para el factor de transcripción o transcription factor Pho4p. Cada fila representa un residuo (A, C, G o T). Cada columna una posición en un conjunto de sitios de unión alineados. Algunas posiciones están perfectamente conservadas en todos los sitios de unión conocidos (el motivo CACGT que comienza en posición 3), mientras que otras posiciones presentan dos opciones (por ejemplo, G o T en la posición 8), y otras posiciones pueden contener cualquier letra, pero con diferentes frecuencias. (por ejemplo, la posición 1 y la posición 10).
Introducción
RSAT tiene un programa llamado convert-matrix https://rsat01.biologie.ens.fr/rsa-tools/convert-matrix_form.cgi que permite extraer una PSSM de los archivos de salida de diferentes programas (consensus, gibbs, MEME, clustal) o bases de datos (JASPAR, TRANSFAC).
Convertir los conteos en frecuencias, pesos e información
Importaremos una matriz que representa la especificidad de unión del factor de transcripción Abf1p, y analizaremos los diferentes parámetros que caracterizan a este PSSM.
- Iremos a SCPD, la base de datos de promotores de Saccharomyces cerevisiae http://rulai.cshl.edu/SCPD/ Para acceder a la lista de sitios por factor, desde la página de inicio del SCPD, haga clic en la sección Regulatory elements and transcriptional factors.
- Haga clic en el enlace a ABF1 y luego en el botón Get matrix. Se mostrara el siguiente PSSM.
Convertir los conteos en frecuencias, pesos e información
Ahora analizaremos el contenido de esta matriz con el programa convert-matrix https://rsat01.biologie.ens.fr/rsa-tools/convert-matrix_form.cgi
- En el menú de la izquierda de la página RSAT, seleccione convert matrix en el formulario bajo el título Matrix tools.
- Copie la matriz ABF1 de SCPD en el área de texto del formulario. Tenga cuidado, solo debe copiar las 4 filas que contienen la información de nucleótidos, y no el encabezado de la matriz.
- Asegúrese de que el formato de matriz seleccionado sea tab.
- Seleccione un organismo modelo relevante: Con el factor Abf1p, marque la opción Organism-specific, seleccione el organismo Saccharomyces_cerevisiae y el tipo de secuencia upstream-noorf.
- Para los campos de resultados, seleccione las siguientes opciones: counts, frequencies, weights, info, margins, parameters, logo.
- Haga click en GO.
Conversión de matriz
La matriz original se convirtió a diferentes formatos. Comentaremos brevemente estos formatos. Conteos Los conteos son la información principal que se obtiene de SCPD. Representan el número de apariciones (frecuencia absoluta) de cada residuo en cada posición de la alineación de los sitios de unión anotados para el factor de transcripción Abf1p. Frecuencias Las frecuencias relativas se obtienen dividiendo los recuentos de cada celda de la matriz por la suma de los recuentos en su columna. Notará que la matriz de frecuencias no refleja fielmente las frecuencias relativas calculadas a partir de los conteos. En particular, las celdas de la matriz original con valores de recuento de 0 tienen valores mayores que 0 en la matriz de frecuencia. Puede verificar esto volviendo al formulario de matriz de conversión (haga clic en el botón Atrás de su navegador) y rehaciendo la conversión con un valor de 0 para la opción pseudo-weight (nota: esto es solo para fines ilustrativos, es generalmente se recomienda usar un pseudo-peso de al menos 1).
Conversión de matriz
Referencias
- Jacques van Helden. (2012, January 15). RSA-tools—Tutorials—Position-specific scoring matrices. https://rsat01.biologie.ens.fr/rsa-tools/tutorials/tut_PSSM.html
