NVTOP (pour Neat Videocard TOP) est un outil de type htop et top servant à surveiller l'utilisation des GPU et des accélérateurs.
Une image qui vaut mille mots
Utilisation des GPU¶
NVTOP peut gérer un ou plusieurs GPU et afficher leur utilisation ainsi que leur mémoire. Vous pouvez aussi sélectionner un autre accélérateur à partir du menu (F2 -> Sélection de GPU).
NVTOP est utile pour suivre et vérifier que votre tâche utilise les GPU de manière optimale.
Tâches non interactives¶
Si vous avez soumis une tâche non interactive et que vous souhaitez surveiller son utilisation du GPU :
-
Depuis un nœud de connexion, trouvez l'ID de la tâche.
-
Attachez-vous à la tâche en cours.
Tâches interactives¶
-
Lancez votre tâche interactive avec le minimum de ressources possible.
-
Dans un autre terminal, connectez-vous au nœud de connexion et trouvez l'ID de la tâche.
-
Attachez-vous à la tâche en cours.
Vous pourrez ainsi observer l'utilisation en temps réel au fur et à mesure que vos commandes s'exécutent dans le premier terminal.
Utilisation des GPU sur un nœud particulier¶
Pour les tâches qui utilisent plusieurs nœuds, vous pouvez vérifier qu'un ou plusieurs GPU sont utilisés le plus efficacement possible.
-
Depuis un nœud de connexion, trouvez l'ID de la tâche et déterminez le nom des nœuds.
-
Attachez-vous à la tâche en cours sur le nœud spécifique. ```bash srun --pty --overlap --jobid JOBID --nodelist NODENAME nvtop