Want to create interactive content? It’s easy in Genially!
MBC-1-M3-R1
CEV PUCE
Created on July 27, 2021
Start designing with a free template
Discover more than 1500 professional designs like these:
View
Corporate Christmas Presentation
View
Business Results Presentation
View
Meeting Plan Presentation
View
Customer Service Manual
View
Business vision deck
View
Economic Presentation
View
Tech Presentation Mobile
Transcript
Biología Computacional
Biopython.
¿Qué es Biopython?
Biopython es un paquete extenso de herramientas, clases y funciones de Python para bioinformática y biología computacional. Se lanzó por primera vez en el año 2000 y ahora contiene más de 300 módulos para tratar con datos biológicos. La versión actual, 1.79, se lanzó en junio 3 del 2021 y requiere Python 3.6 o posterior. Una versión anterior, 1.76, es compatible con Python 2.7 a 3.5.
Datos de secuencia en Biopython
En Biopython, los datos de secuencia están representados por una clase Seq, que incluye métodos de secuencia biológica como transcribir o traducir, y especifica el alfabeto de secuencia utilizado. La clase SeqRecord describe secuencias, con características descritas por objetos SeqFeature.
Datos biológicos en Biopython
Biopython maneja la importación y exportación de datos biológicos de una amplia variedad de formatos, incluidos Clustal, DNA Strider, FASTA, GenBank, mmCIF, Newick, NEXUS, PDB, PHYLIP y phyloXML utilizando Bio.SeqIO y otros módulos. El módulo Bio.Entrez puede descargar e importar datos directamente desde varias bases de datos del NCBI. Los datos de filogenia se pueden importar a objetos Tree and Clade y se pueden atravesar y analizar utilizando el módulo Bio.Phylo. Los datos de estructura molecular se pueden importar a los objetos de Estructura y examinar y analizar utilizando el módulo Bio.PDB.
Biopython
Otras características de Biopython incluyen un módulo GenomeDiagram para visualizar datos de secuencia y genoma, un módulo Bio.PopGen para interactuar con Genepop, soporte para el modelo y esquema de , y una serie de envoltorios de línea de comandos que permiten la interacción de Python con herramientas bioinformáticas de uso común, como como BLAST, Clustal y EMBOSS.
¿Qué no es Biopython?
- Una herramienta para todo.
- Una colección de algoritmos.
- Una solución para su problema específico.
- Especializado en NGS.
- Calculadora de estadísticas.
Biopython básico
sudo pip install "biopython==1.79” (or sudo pip install biopython if running Python 3.6 or later) python >>> import Bio >>> from Bio.Seq import Seq >>> my_seq = Seq('ATGCATTAG’) >>> print 'Sequence %s is %i bases long' % (my_seq, len(my_seq)) >>> print 'Reverse complement is %s' % my_seq.reverse_complement() >>> print 'Protein translation is %s' % my_seq.translate()
Bio.Entrez
from Bio import Entrez Entrez.email = 'allegra.via@uniroma1.it’ Entrez.esearch( db = 'nucleotide / protein / pubmed ..’, term = 'words AND more words NOT bad words’, retmax = 100 ) Entrez.efetch( db = 'nucleotide / protein / pubmed ..’, retmode = 'gb / fasta / xml’, id
Biopython y sequences
#!/usr/bin/python from Bio import SeqIO from Bio.SeqUtils import GC for sr in SeqIO.parse ("test.fasta", "fasta"): print (sr.id) print (repr(sr.seq)) print (len(sr)) print (sr.seq) print GC(sr.seq) print (sr.seq.transcribe()) print (sr.seq.translate()) print (sr.seq.translate(to_stop=True))
Biopython y parsing
genbank.py #!/usr/bin/python from Bio import Entrez Entrez.email = "mi@columbia.edu" handle = Entrez.efetch(db="nucleotide", rettype="gb", retmode="text", id="2765658") save_file = open("2765658.gbk", 'w’) save_file.write(handle.read()) handle.close() save_file.close()
Biopython y parsing
parsefasta.py
convert.py
#!/usr/bin/python from Bio import SeqIO SeqIO.convert("2765658.gbk", "genbank", "2765658.fasta", "fasta")
#!/usr/bin/python from Bio import SeqIO recs = SeqIO.parse("cosmids1.fasta", "fasta") for rec in recs: print rec.id
Anaconda
Anaconda es una plataforma gratuita de ciencia de datos de código abierto impulsada por los lenguajes de programación Python y R que incluye más de 100 de los paquetes más populares para la ciencia de datos, incluidos NumPy, Pandas, SciPy, Matplotlib y Jupyter Notebook. Anaconda incluye el paquete conda, el administrador de dependencias y entornos, que puede instalar fácilmente más de 1,000 paquetes de ciencia de datos adicionales en una variedad de idiomas, así como el administrador de paquetes pip. Anaconda también incluye una interfaz gráfica de usuario, Anaconda Navigator, y es compatible con una variedad de entornos de desarrollo integrados (IDE), incluidos Eclipse / PyDev y Spyder. Anaconda le permite ejecutar múltiples versiones de Python en entornos aislados. Para volver a usar Python 2.7 estándar en OS X, use BBEdit para Abra .bash_profile (con Mostrar elemento oculto marcado) y agregue un # de la siguiente manera: # export PATH = "/ Users / support / anaconda / bin: $ PATH"
Anaconda, Biopython y BLAST
#!/usr/bin/python from Bio.Blast import NCBIWWW result_handle = NCBIWWW.qblast("blastn", "nt", "8332116") from Bio.Blast import NCBIXML blast_record = NCBIXML.read(result_handle) E_VALUE_THRESH = 0.04 for alignment in blast_record.alignments: for hsp in alignment.hsps: if hsp.expect < E_VALUE_THRESH: print('\n****Alignment****’) print('*Sequence:', alignment.title) print('*Length:', hsp.align_length) print('*Identities:', hsp.identities) id = (100.00 * hsp.identities / hsp.align_length) print ('*Precent identity:', id) print('*E-value:', hsp.expect) print(hsp.query[0:75] + '...') print(hsp.match[0:75] + '...’) print(hsp.sbjct[0:75] + '...')
Chang, J., Chapman, B., Friedberg, I., Hamelryck, T., Hoon, M. de, Peter Cock, Antao, T., Talevich, E., & Wilczyński, B. (2021). Biopython Tutorial and Cookbook. Biopython. http://biopython.org/DIST/docs/tutorial/Tutorial.html
Jovanovic, O. (2020). Introduction to Computational & Quantitative Biology. Department of Microbiology & Immunology. https://microbiology.columbia.edu/icqb
Referencias
Kristian Rother. (2021). Introduction to Biopython. https://data.bits.vib.be/pub/trainingen/Biopython/BiopythonTitle.pdf
Cock, P. J. A., Antao, T., Chang, J. T., Chapman, B. A., Cox, C. J., Dalke, A., Friedberg, I., Hamelryck, T., Kauff, F., Wilczynski, B., & de Hoon, M. J. L. (2009). Biopython: Freely available Python tools for computational molecular biology and bioinformatics. Bioinformatics, 25(11), 1422–1423. https://doi.org/10.1093/bioinformatics/btp163
