Descargue los datos e instale los paquetes
pip install gdown # Instalará una herramienta que permite descargar archivos desde google drive
gdown --folder https://drive.google.com/drive/folders/1Sk4rzPMWpA5nLGr1bwt4JOB2yKQUKfd0
cd clase_alineamientos # El comando "cd" le permite moverse de un directorio (carpeta) a otro. Debe poner la dirección del nuevo directorio.
Remover el ambiente de conda instalado previamente
conda remove -n pymsaviz --all -y
Instalar nuevamente
Instalar la herramienta a utilizar, la documentación está disponible aquí.
conda create -n pymsaviz -c conda-forge -c bioconda pymsaviz -y
conda activate pymsaviz
python
Al Ejecucutar el comando “python” se le abrirá un tipo de nueva interfaz dónde los códigos que ejecutemos deben ser de python.
Los siguientes comando crearan figuras de alineamiento.
Visualización con el paquete pymsaviz
from pymsaviz import MsaViz # En python hay que especificar qué funciones queremos importar. En esta caso sólo utilizaremos la función MsaViz de la librería pymsaviz
msa= "aligned.fas" # Generamos un objeto llamado msa, que contiene el archivo fasta con las secuencias alineadas.
mv = MsaViz(msa, format="fasta") # mv es un nuevo objeto que va a guardar el resultado de la función "MsaViz" que contiene toda la información necesaria para la visualización
mv.savefig("plot.png") # el ".savefig" indica que guardemos la figura que está dentro del archivo que creameos previamente llamado "mv". En los paréntesis y en comillas pueden poner el nombre que quieran ponerle
Nueva versión del gráfico
mv2 = MsaViz(msa, wrap_length=60, show_grid=True, show_consensus=True, format="fasta")
mv2.savefig("plot2.png")
Otra versión
mv3 = MsaViz(msa, wrap_length=60, color_scheme="Flower", show_count=True, start=370, end=760, show_seq_char=False, show_consensus=True, consensus_color="tomato", format="fasta")
mv3.savefig("plot3.png")
Vamos a añadir una marca en la mutación encontrada
mv3.add_markers([555], color="red", marker="x") # la posición dónde está la mutación es la 555 de la secuencia de ref.
mv3.savefig("plot_with_mark.png") # Guarda el nuevo plot con el nombre, plot with mark
Otro ejemplo con proteínas FIC
Estas proteínas son sacadas de este artículo en dónde estudiamos los plásmidos de H. pylori. Son proteínas relacionadas con patogenicidad pero también con sistemas toxina-antitoxina. Todas deberían tener el “motif” HxFx(D/E)GNGRxxR
msa= "fic_aligned.fas"
mv = MsaViz(msa, wrap_length=50, color_scheme="Flower", show_count=True, show_seq_char=True, show_consensus=True, consensus_color="tomato", start=540, format="fasta")
mv.add_text_annotation((709, 720), "Adenylytation motif", text_color="red", range_color="red")
mv.savefig("Fic_plot.png")
Tarea
Busque al menos 3 (pueden ser más) secuencias de algún gen de interés en diferentes especies y anote alguna de las mutaciones y gaps (indels) encontrados.
Debe dar una breve introducción del gen utilizado.