Want to create interactive content? It’s easy in Genially!

Get started free

MBC-1-M3-R1

CEV PUCE

Created on July 27, 2021

Start designing with a free template

Discover more than 1500 professional designs like these:

Corporate Christmas Presentation

Business Results Presentation

Meeting Plan Presentation

Customer Service Manual

Business vision deck

Economic Presentation

Tech Presentation Mobile

Transcript

Biología Computacional

Biopython.

¿Qué es Biopython?

Biopython es un paquete extenso de herramientas, clases y funciones de Python para bioinformática y biología computacional. ​ ​ Se lanzó por primera vez en el año 2000 y ahora contiene más de 300 módulos para tratar con datos biológicos. ​ ​ La versión actual, 1.79, se lanzó en junio 3 del 2021 y requiere Python 3.6 o posterior. Una versión anterior, 1.76, es compatible con Python 2.7 a 3.5.

Datos de secuencia en Biopython​

En Biopython, los datos de secuencia están representados por una clase Seq, que incluye métodos de secuencia biológica como transcribir o traducir, y especifica el alfabeto de secuencia utilizado. La clase SeqRecord describe secuencias, con características descritas por objetos SeqFeature.

Datos biológicos en Biopython​

Biopython maneja la importación y exportación de datos biológicos de una amplia variedad de formatos, incluidos Clustal, DNA Strider, FASTA, GenBank, mmCIF, Newick, NEXUS, PDB, PHYLIP y phyloXML utilizando Bio.SeqIO y otros módulos. ​ ​ El módulo Bio.Entrez puede descargar e importar datos directamente desde varias bases de datos del NCBI. ​ ​ Los datos de filogenia se pueden importar a objetos Tree and Clade y se pueden atravesar y analizar utilizando el módulo Bio.Phylo. ​ ​ Los datos de estructura molecular se pueden importar a los objetos de Estructura y examinar y analizar utilizando el módulo Bio.PDB.

Biopython​

Otras características de Biopython incluyen un módulo GenomeDiagram para visualizar datos de secuencia y genoma, un módulo Bio.PopGen para interactuar con Genepop, soporte para el modelo y esquema de , y una serie de envoltorios de línea de comandos que permiten la interacción de Python con herramientas bioinformáticas de uso común, como como BLAST, Clustal y EMBOSS.

¿Qué no es Biopython?​

  • Una herramienta para todo.​
  • Una colección de algoritmos.​
  • Una solución para su problema específico.​
  • Especializado en NGS.​
  • Calculadora de estadísticas.​
​ Sin embargo, es bastante útil de todos modos.

Biopython básico​

sudo pip install "biopython==1.79”​ (or sudo pip install biopython if running Python 3.6 or later) ​ ​ python ​ ​ >>> import Bio ​ >>> from Bio.Seq import Seq ​ >>> my_seq = Seq('ATGCATTAG’) ​ >>> print 'Sequence %s is %i bases long' % (my_seq, len(my_seq)) ​ >>> print 'Reverse complement is %s' % my_seq.reverse_complement() ​ >>> print 'Protein translation is %s' % my_seq.translate()

Bio.Entrez​

from Bio import Entrez ​​ Entrez.email = 'allegra.via@uniroma1.it’ ​ ​ Entrez.esearch(​ db = 'nucleotide / protein / pubmed ..’, ​ term = 'words AND more words NOT bad words’, ​ retmax = 100 ​ ) ​ ​ Entrez.efetch(​ db = 'nucleotide / protein / pubmed ..’, ​ retmode = 'gb / fasta / xml’, ​ id

Biopython y sequences​

#!/usr/bin/python​ ​ from Bio import SeqIO ​ from Bio.SeqUtils import GC ​ ​ for sr in SeqIO.parse ("test.fasta", "fasta"): ​ print (sr.id) ​ print (repr(sr.seq))​ print (len(sr)) ​ print (sr.seq) ​ print GC(sr.seq) ​ print (sr.seq.transcribe()) ​ print (sr.seq.translate()) ​ print (sr.seq.translate(to_stop=True))

Biopython y parsing​

genbank.py ​ ​ ​ #!/usr/bin/python ​ ​ from Bio import Entrez​ Entrez.email = "mi@columbia.edu"​ handle = Entrez.efetch(db="nucleotide", rettype="gb", retmode="text", id="2765658") ​ save_file = open("2765658.gbk", 'w’) ​ save_file.write(handle.read()) ​ handle.close() ​ save_file.close()

Biopython y parsing​

parsefasta.py

convert.py

#!/usr/bin/python​ ​ from Bio import SeqIO ​ SeqIO.convert("2765658.gbk", "genbank", "2765658.fasta", "fasta")

#!/usr/bin/python​ ​ from Bio import SeqIO​ recs = SeqIO.parse("cosmids1.fasta", "fasta")​ for rec in recs:​ print rec.id

Anaconda​

Anaconda es una plataforma gratuita de ciencia de datos de código abierto impulsada por los lenguajes de programación Python y R que incluye más de 100 de los paquetes más populares para la ciencia de datos, incluidos NumPy, Pandas, SciPy, Matplotlib y Jupyter Notebook.​ ​ Anaconda incluye el paquete conda, el administrador de dependencias y entornos, que puede instalar fácilmente más de 1,000 paquetes de ciencia de datos adicionales en una variedad de idiomas, así como el administrador de paquetes pip. Anaconda también incluye una interfaz gráfica de usuario, Anaconda Navigator, y es compatible con una variedad de entornos de desarrollo integrados (IDE), incluidos Eclipse / PyDev y Spyder.​ ​ Anaconda le permite ejecutar múltiples versiones de Python en entornos aislados. Para volver a usar Python 2.7 estándar en OS X, use BBEdit para​ Abra .bash_profile (con Mostrar elemento oculto marcado) y agregue un # de la siguiente manera: ​ ​ # export PATH = "/ Users / support / anaconda / bin: $ PATH"

Anaconda, Biopython y BLAST​

#!/usr/bin/python​ ​ from Bio.Blast import NCBIWWW​ result_handle = NCBIWWW.qblast("blastn", "nt", "8332116") ​ from Bio.Blast import NCBIXML ​ blast_record = NCBIXML.read(result_handle) ​ E_VALUE_THRESH = 0.04 ​ for alignment in blast_record.alignments: ​ for hsp in alignment.hsps: ​ if hsp.expect < E_VALUE_THRESH: ​ print('\n****Alignment****’) ​ print('*Sequence:', alignment.title) ​ print('*Length:', hsp.align_length) ​ print('*Identities:', hsp.identities) ​ id = (100.00 * hsp.identities / hsp.align_length) ​ print ('*Precent identity:', id) print('*E-value:', hsp.expect) ​ print(hsp.query[0:75] + '...') print(hsp.match[0:75] + '...’) ​ print(hsp.sbjct[0:75] + '...')

Chang, J., Chapman, B., Friedberg, I., Hamelryck, T., Hoon, M. de, Peter Cock, Antao, T., Talevich, E., & Wilczyński, B. (2021). Biopython Tutorial and Cookbook. Biopython. http://biopython.org/DIST/docs/tutorial/Tutorial.html

Jovanovic, O. (2020). Introduction to Computational & Quantitative Biology. Department of Microbiology & Immunology. https://microbiology.columbia.edu/icqb

Referencias​

Kristian Rother. (2021). Introduction to Biopython. https://data.bits.vib.be/pub/trainingen/Biopython/BiopythonTitle.pdf

Cock, P. J. A., Antao, T., Chang, J. T., Chapman, B. A., Cox, C. J., Dalke, A., Friedberg, I., Hamelryck, T., Kauff, F., Wilczynski, B., & de Hoon, M. J. L. (2009). Biopython: Freely available Python tools for computational molecular biology and bioinformatics. Bioinformatics, 25(11), 1422–1423. https://doi.org/10.1093/bioinformatics/btp163