Want to create interactive content? It’s easy in Genially!

MBC-1-M3-R1

CEV PUCE

Created on July 27, 2021

Start designing with a free template

Discover more than 1500 professional designs like these:

Corporate Christmas Presentation

Business Results Presentation

Meeting Plan Presentation

Customer Service Manual

Business vision deck

Economic Presentation

Tech Presentation Mobile

Explore all templates

Biología Computacional

Biopython.

¿Qué es Biopython?

Biopython es un paquete extenso de herramientas, clases y funciones de Python para bioinformática y biología computacional. Se lanzó por primera vez en el año 2000 y ahora contiene más de 300 módulos para tratar con datos biológicos. La versión actual, 1.79, se lanzó en junio 3 del 2021 y requiere Python 3.6 o posterior. Una versión anterior, 1.76, es compatible con Python 2.7 a 3.5.

Datos de secuencia en Biopython

En Biopython, los datos de secuencia están representados por una clase Seq, que incluye métodos de secuencia biológica como transcribir o traducir, y especifica el alfabeto de secuencia utilizado. La clase SeqRecord describe secuencias, con características descritas por objetos SeqFeature.

Datos biológicos en Biopython

Biopython maneja la importación y exportación de datos biológicos de una amplia variedad de formatos, incluidos Clustal, DNA Strider, FASTA, GenBank, mmCIF, Newick, NEXUS, PDB, PHYLIP y phyloXML utilizando Bio.SeqIO y otros módulos. El módulo Bio.Entrez puede descargar e importar datos directamente desde varias bases de datos del NCBI. Los datos de filogenia se pueden importar a objetos Tree and Clade y se pueden atravesar y analizar utilizando el módulo Bio.Phylo. Los datos de estructura molecular se pueden importar a los objetos de Estructura y examinar y analizar utilizando el módulo Bio.PDB.

Biopython

Otras características de Biopython incluyen un módulo GenomeDiagram para visualizar datos de secuencia y genoma, un módulo Bio.PopGen para interactuar con Genepop, soporte para el modelo y esquema de , y una serie de envoltorios de línea de comandos que permiten la interacción de Python con herramientas bioinformáticas de uso común, como como BLAST, Clustal y EMBOSS.

¿Qué no es Biopython?

Una herramienta para todo.
Una colección de algoritmos.
Una solución para su problema específico.
Especializado en NGS.
Calculadora de estadísticas.

Sin embargo, es bastante útil de todos modos.

Biopython básico

sudo pip install "biopython==1.79” (or sudo pip install biopython if running Python 3.6 or later) python >>> import Bio >>> from Bio.Seq import Seq >>> my_seq = Seq('ATGCATTAG’) >>> print 'Sequence %s is %i bases long' % (my_seq, len(my_seq)) >>> print 'Reverse complement is %s' % my_seq.reverse_complement() >>> print 'Protein translation is %s' % my_seq.translate()

Bio.Entrez

from Bio import Entrez Entrez.email = 'allegra.via@uniroma1.it’ Entrez.esearch( db = 'nucleotide / protein / pubmed ..’, term = 'words AND more words NOT bad words’, retmax = 100 ) Entrez.efetch( db = 'nucleotide / protein / pubmed ..’, retmode = 'gb / fasta / xml’, id

Biopython y sequences

#!/usr/bin/python from Bio import SeqIO from Bio.SeqUtils import GC for sr in SeqIO.parse ("test.fasta", "fasta"): print (sr.id) print (repr(sr.seq)) print (len(sr)) print (sr.seq) print GC(sr.seq) print (sr.seq.transcribe()) print (sr.seq.translate()) print (sr.seq.translate(to_stop=True))

Biopython y parsing

genbank.py #!/usr/bin/python from Bio import Entrez Entrez.email = "mi@columbia.edu" handle = Entrez.efetch(db="nucleotide", rettype="gb", retmode="text", id="2765658") save_file = open("2765658.gbk", 'w’) save_file.write(handle.read()) handle.close() save_file.close()

Biopython y parsing

parsefasta.py

convert.py

#!/usr/bin/python from Bio import SeqIO SeqIO.convert("2765658.gbk", "genbank", "2765658.fasta", "fasta")

#!/usr/bin/python from Bio import SeqIO recs = SeqIO.parse("cosmids1.fasta", "fasta") for rec in recs: print rec.id

Anaconda

Anaconda es una plataforma gratuita de ciencia de datos de código abierto impulsada por los lenguajes de programación Python y R que incluye más de 100 de los paquetes más populares para la ciencia de datos, incluidos NumPy, Pandas, SciPy, Matplotlib y Jupyter Notebook. Anaconda incluye el paquete conda, el administrador de dependencias y entornos, que puede instalar fácilmente más de 1,000 paquetes de ciencia de datos adicionales en una variedad de idiomas, así como el administrador de paquetes pip. Anaconda también incluye una interfaz gráfica de usuario, Anaconda Navigator, y es compatible con una variedad de entornos de desarrollo integrados (IDE), incluidos Eclipse / PyDev y Spyder. Anaconda le permite ejecutar múltiples versiones de Python en entornos aislados. Para volver a usar Python 2.7 estándar en OS X, use BBEdit para Abra .bash_profile (con Mostrar elemento oculto marcado) y agregue un # de la siguiente manera: # export PATH = "/ Users / support / anaconda / bin: $ PATH"

Anaconda, Biopython y BLAST

#!/usr/bin/python from Bio.Blast import NCBIWWW result_handle = NCBIWWW.qblast("blastn", "nt", "8332116") from Bio.Blast import NCBIXML blast_record = NCBIXML.read(result_handle) E_VALUE_THRESH = 0.04 for alignment in blast_record.alignments: for hsp in alignment.hsps: if hsp.expect < E_VALUE_THRESH: print('\n****Alignment****’) print('*Sequence:', alignment.title) print('*Length:', hsp.align_length) print('*Identities:', hsp.identities) id = (100.00 * hsp.identities / hsp.align_length) print ('*Precent identity:', id) print('*E-value:', hsp.expect) print(hsp.query[0:75] + '...') print(hsp.match[0:75] + '...’) print(hsp.sbjct[0:75] + '...')

Chang, J., Chapman, B., Friedberg, I., Hamelryck, T., Hoon, M. de, Peter Cock, Antao, T., Talevich, E., & Wilczyński, B. (2021). Biopython Tutorial and Cookbook. Biopython. http://biopython.org/DIST/docs/tutorial/Tutorial.html

Jovanovic, O. (2020). Introduction to Computational & Quantitative Biology. Department of Microbiology & Immunology. https://microbiology.columbia.edu/icqb

Referencias

Kristian Rother. (2021). Introduction to Biopython. https://data.bits.vib.be/pub/trainingen/Biopython/BiopythonTitle.pdf

Cock, P. J. A., Antao, T., Chang, J. T., Chapman, B. A., Cox, C. J., Dalke, A., Friedberg, I., Hamelryck, T., Kauff, F., Wilczynski, B., & de Hoon, M. J. L. (2009). Biopython: Freely available Python tools for computational molecular biology and bioinformatics. Bioinformatics, 25(11), 1422–1423. https://doi.org/10.1093/bioinformatics/btp163

MBC-1-M3-R1

Start designing with a free template

View

Corporate Christmas Presentation

View

Business Results Presentation

View

Meeting Plan Presentation

View

Customer Service Manual

View

Business vision deck

View

Economic Presentation

View

Tech Presentation Mobile

Transcript