Instalación de anvio
Vamos a utilizar wsl nuevamente para instalar Anvio y poder visualizar los análisis pangenómicos. Primero preparemos un ambiente llamado anvio-8. Si no tiene wsl, baje al final y revise cómo correrlo en el cluster.
El tutorial está basado en el mismo de la página de Anvio
#Actualizar conda
conda update conda
conda create -y --name anvio-8 python=3.10
conda activate anvio-8
pip install matplotlib==3.5.1
Instalación de dependencias
conda install -y -c conda-forge -c bioconda python=3.10 \
sqlite prodigal idba mcl muscle=3.8.1551 famsa hmmer diamond \
blast megahit spades bowtie2 bwa graphviz "samtools>=1.9" \
trimal iqtree trnascan-se fasttree vmatch r-base r-tidyverse \
r-optparse r-stringi r-magrittr bioconductor-qvalue meme ghostscript
conda install -y -c bioconda fastani
#Si fastani no se instala tranquilos!
Descarguemos anvio
curl -L https://github.com/merenlab/anvio/releases/download/v8/anvio-8.tar.gz \
--output anvio-8.tar.gz
#Instalación con pip
pip install anvio-8.tar.gz
Si el comando anterior no sirve, hay que reinstalar una dependencia de forma manual.
wget https://files.pythonhosted.org/packages/c4/aa/94c42a2dd30c4923bffe3ab59e4416c3f7e72dbd32a89bcdd8d43ff1d5d7/datrie-0.8.2-pp373-pypy36_pp73-win32.whl
mv datrie-0.8.2-pp373-pypy36_pp73-win32.whl datrie-0.8.2-cp310-none-any.whl
pip install datrie-0.8.2-cp310-none-any.whl
#Probamos de nuevo
pip install anvio-8.tar.gz
Muy bien! Ahora descarguemos los fatos
wget https://ndownloader.figshare.com/files/28834476 -O Prochlorococcus_31_genomes.tar.gz
tar -zxvf Prochlorococcus_31_genomes.tar.gz
cd Prochlorococcus_31_genomes
anvi-migrate *.db --migrate-quickly
Los comandos anteriores descargan y descomprimen los datos que son bases de datos de anvio.
Análisis pangenómico
Revise el archivo external-genomes con el comando cat, ustedes van a necesitar uno así para sus genomas.
El comando anvi-pan-genome puede tardar varios minutos (15-30) dependiendo de su computador. Modifique el número de threads dependiendo de los que tenga su laptop.
anvi-gen-genomes-storage -e external-genomes.txt \
-o PROCHLORO-GENOMES.db
anvi-pan-genome -g PROCHLORO-GENOMES.db \
--project-name "Prochlorococcus_Pan" \
--output-dir PROCHLORO \
--num-threads 6 \
--minbit 0.5 \
--mcl-inflation 10 \
--use-ncbi-blast
#Importar subgrupos. Puede abrir y revisar el archivo layer-additional-data
anvi-import-misc-data layer-additional-data.txt \
-p PROCHLORO/Prochlorococcus_Pan-PAN.db \
--target-data-table layers
Análisis en Kabré
Para los que no tienen wsl (:C) ingresen al cluster pero ahora utilizando el siguiente comando:
#Para conectarse reemplace su usuario
ssh -p 22022 -L 8080:localhost:8080 usuario@kabre.cenat.ac.cr
#Digite su contraseña
Ahora copien la carpeta y ejecuten el slurm
module load miniconda/anvio-7.1
cp -r /work/bmendoza/CURSO/PROCHLORO PROCHLORO
sbatch pangenome.slurm
De aquí en adelante tanto los que trabajen con wsl como los que trabajen con el clúster deben ejecutar los comandos directamente en la terminal.
Visualización del Pangenoma
anvi-display-pan -g PROCHLORO-GENOMES.db \
-p PROCHLORO/Prochlorococcus_Pan-PAN.db
Para visualizar el pangenoma, vaya a su navegador de confianza y pegue la siguiente dirección: http://localhost:8080
Importar layers
anvi-import-state -p PROCHLORO/Prochlorococcus_Pan-PAN.db \
--state pan-state.json \
--name default
Nueva visualización
anvi-display-pan -g PROCHLORO-GENOMES.db \
-p PROCHLORO/Prochlorococcus_Pan-PAN.db