Want to create interactive content? It’s easy in Genially!

Get started free

MBC-6-M2-R2

CEV PUCE

Created on May 3, 2021

Start designing with a free template

Discover more than 1500 professional designs like these:

Higher Education Presentation

Psychedelic Presentation

Vaporwave presentation

Geniaflix Presentation

Vintage Mosaic Presentation

Modern Zen Presentation

Newspaper Presentation

Transcript

Algoritmos de la Biología Computacional

Conversión y análisis de PSSM.

Maestría en Economía Circular

Introducción

Las matrices de puntuación específicas de posición (PSSM):

  • Son una forma flexible de representar la especificidad de las interacciones entre el factor de transcripción y el ADN. Transcription factor/DNA interactions.
  • Se pueden construir sobre la base de un conjunto de sitios de unión conocidos para el factor de interés. Known bindind sites for the factor of interest.

Bases de datos de factores de transcripción

El PSSM basado en el conocimiento se puede obtener de varias bases de datos de factores de transcripción, por ejemplo:

JASPAR (Eukaryotes) http://jaspar.genereg.net/ RegulonDB (Escherichia coli K12) http://regulondb.ccg.unam.mx/ SCPD (The Promoter Database of Saccharomcyces cerevisiae) http://rulai.cshl.edu/SCPD/ Yeastract (Yeast Search for Transcriptional Regulators And Consensus Tracking) http://www.yeastract.com/ TRANSFAC (Note: the full database access requires a commercial license) http://gene-regulation.com/pub/databases.html#transfac

Matriz

La siguiente matriz de alineamiento o de conteo se obtuvo del SCPD, la base de datos de promotores de Saccharomyces cerevisiae. NO ES UNA PSSM. Se ha construido a partir de un alineamiento de 12 sitios de unión o binding sites para el factor de transcripción o transcription factor Pho4p. Cada fila representa un residuo (A, C, G o T). Cada columna una posición en un conjunto de sitios de unión alineados. Algunas posiciones están perfectamente conservadas en todos los sitios de unión conocidos (el motivo CACGT que comienza en posición 3), mientras que otras posiciones presentan dos opciones (por ejemplo, G o T en la posición 8), y otras posiciones pueden contener cualquier letra, pero con diferentes frecuencias. (por ejemplo, la posición 1 y la posición 10).

Introducción

RSAT tiene un programa llamado convert-matrix https://rsat01.biologie.ens.fr/rsa-tools/convert-matrix_form.cgi que permite extraer una PSSM de los archivos de salida de diferentes programas (consensus, gibbs, MEME, clustal) o bases de datos (JASPAR, TRANSFAC).

Convertir los conteos en frecuencias, pesos e información

Importaremos una matriz que representa la especificidad de unión del factor de transcripción Abf1p, y analizaremos los diferentes parámetros que caracterizan a este PSSM.

  1. Iremos a SCPD, la base de datos de promotores de Saccharomyces cerevisiae http://rulai.cshl.edu/SCPD/ Para acceder a la lista de sitios por factor, desde la página de inicio del SCPD, haga clic en la sección Regulatory elements and transcriptional factors.
  2. Haga clic en el enlace a ABF1 y luego en el botón Get matrix. Se mostrara el siguiente PSSM.

Convertir los conteos en frecuencias, pesos e información

Ahora analizaremos el contenido de esta matriz con el programa convert-matrix https://rsat01.biologie.ens.fr/rsa-tools/convert-matrix_form.cgi

  1. En el menú de la izquierda de la página RSAT, seleccione convert matrix en el formulario bajo el título Matrix tools.
  2. Copie la matriz ABF1 de SCPD en el área de texto del formulario. Tenga cuidado, solo debe copiar las 4 filas que contienen la información de nucleótidos, y no el encabezado de la matriz.
  3. Asegúrese de que el formato de matriz seleccionado sea tab.
  4. Seleccione un organismo modelo relevante: Con el factor Abf1p, marque la opción Organism-specific, seleccione el organismo Saccharomyces_cerevisiae y el tipo de secuencia upstream-noorf.
  5. Para los campos de resultados, seleccione las siguientes opciones: counts, frequencies, weights, info, margins, parameters, logo.
  6. Haga click en GO.

Conversión de matriz

La matriz original se convirtió a diferentes formatos. Comentaremos brevemente estos formatos. Conteos Los conteos son la información principal que se obtiene de SCPD. Representan el número de apariciones (frecuencia absoluta) de cada residuo en cada posición de la alineación de los sitios de unión anotados para el factor de transcripción Abf1p. Frecuencias Las frecuencias relativas se obtienen dividiendo los recuentos de cada celda de la matriz por la suma de los recuentos en su columna. Notará que la matriz de frecuencias no refleja fielmente las frecuencias relativas calculadas a partir de los conteos. En particular, las celdas de la matriz original con valores de recuento de 0 tienen valores mayores que 0 en la matriz de frecuencia. Puede verificar esto volviendo al formulario de matriz de conversión (haga clic en el botón Atrás de su navegador) y rehaciendo la conversión con un valor de 0 para la opción pseudo-weight (nota: esto es solo para fines ilustrativos, es generalmente se recomienda usar un pseudo-peso de al menos 1).

Conversión de matriz

Referencias

  • Jacques van Helden. (2012, January 15). RSA-tools—Tutorials—Position-specific scoring matrices. https://rsat01.biologie.ens.fr/rsa-tools/tutorials/tut_PSSM.html