Skip to content

VirSorter2/fr

VirSorter2 permet d’identifier les nouvelles séquences de virus.

Nous abordons ici l’installation et l’utilisation de VirSorter2 v2.2.4.

Le code source et la documentation pour VirSorter2 se trouvent sur leur page GitHub.

N’oubliez pas de citer VirSorter2 si vous l’utilisez pour vos analyses.

Installation dans un environnement virtuel Python

Les étapes ci-dessous servent à installer VirSorter2 dans votre répertoire $HOME avec nos wheels Python préconstruits. Les wheels personnalisés se trouvent dans /cvmfs/soft.computecanada.ca/custom/python/wheelhouse/. Pour installer un wheel VirSorter2 dans un environnement virtuel Python, nous utilisons la commande pip.

  1. Chargez les modules nécessaires.
    module load StdEnv/2020 python/3.8 hmmer/3.3.2 prodigal/2.6.3
    
  2. Créez et activez un environnement virtuel Python.
    virtualenv --no-download ~/ENV_virsorter
    source ~/ENV_virsorter/bin/activate
    
  3. Installez VirSorter2 v2.2.4 dans l’environnement virtuel.
    pip install --no-index --upgrade pip
    pip install --no-index virsorter==2.2.4
    
  4. Validez l'installation.
    virsorter -h
    
  5. Gelez l’environnement et les éléments requis (requirements.txt).
    pip freeze > ~/virsorter-2.2.4-requirements.txt
    
  6. Téléchargez la base de données dans votre répertoire $SCRATCH en utilisant l'option --skip-deps-install pour ne pas installer conda et aussi parce que les dépendances sont déjà installées.
    virsorter setup --db-dir $SCRATCH/db -j 4 --skip-deps-install
    

Tester VirSorter2

  1. Désactivez votre environnement virtuel.
    deactivate
    
  2. Téléchargez l’ensemble de données dans votre répertoire $SCRATCH.
    wget -O $SCRATCH/test.fa https://raw.githubusercontent.com/jiarong/VirSorter2/master/test/8seq.fa
    
  3. Créez un script pour soumettre une tâche à l’ordonnanceur.
    test-virsorter.sh
    #!/bin/bash
    
    #SBATCH --time=00:30:00
    #SBATCH --mem-per-cpu=2G
    #SBATCH --cpus-per-task=2
    
    # Load modules dependencies
    module load StdEnv/2020 python/3.8 hmmer/3.3.2 prodigal/2.6.3
    
    # Generate your virtual environment in $SLURM_TMPDIR
    virtualenv --no-download $SLURM_TMPDIR/ENV
    source $SLURM_TMPDIR/ENV/bin/activate
    pip install --no-index --upgrade pip
    
    # Install VirSorter2 and its dependencies
    pip install --no-index -r ~/virsorter-2.2.4-requirements.txt
    
    # Run VirSorter2 with the test dataset, using at most $SLURM_CPUS_PER_TASK and ignore conda.
    # The database must already exist and you must specify its location.
    virsorter run -w $SCRATCH/test.out -i $SCRATCH/test.fa --min-length 1500 -j $SLURM_CPUS_PER_TASK --verbose --use-conda-off --db-dir $SCRATCH/db all
    
  4. Lancez une tâche interactive.
    salloc --mem-per-cpu=2G --cpus-per-task=2 --account=<votre-compte>
    
    salloc: Granted job allocation 1234567
    
    bash test-virsorter.sh # Exécutez le script de soumission
    
    exit                   # Terminez l'allocation
    
    salloc: Relinquishing job allocation 1234567
    

Si le test est réussi, vous pouvez utiliser la commande sbatch pour soumettre une tâche avec votre propre ensemble de données.