Using cloud vGPUs/fr
Cette page décrit comment * allouer des ressources de GPU virtuel (vGPU) à une machine virtuelle (VM), * installer les pilotes nécessaires et * vérifier si le vGPU peut être utilisé. L'accès aux dépôts de données ainsi qu'aux vGPU n'est actuellement disponible que sur le nuage Arbutus. Veuillez noter que la documentation ci-dessous ne couvre que l'installation du pilote vGPU. La boîte à outils CUDA n'est pas préinstallée, mais vous pouvez l'installer directement à partir de NVIDIA ou la charger de la pile logicielle dans CVMFS. Si vous choisissez d'installer la boîte à outils directement de NVIDIA, assurez-vous que le pilote vGPU n'est pas écrasé par celui de CUDA.
Gabarits pris en charge¶
Pour utiliser un vGPU dans une machine virtuelle, l'instance doit être déployée sur un des gabarits mentionnés ci-dessous. Le vGPU sera disponible pour le système d'exploitation via le bus PCI.
- g1-12gb-c3-35gb-125
- g1-24gb-c6-70gb-250
Préparer une machine virtuelle¶
Une fois que la machine virtuelle est disponible, assurez-vous de mettre à jour le système d'exploitation avec la dernière version disponible, y compris le noyau (kernel).
Redémarrage requis
Redémarrez ensuite la machine virtuelle pour avoir le dernier noyau.
Nous recommandons l'installation de DKMS, qui est disponible par défaut dans toutes les distributions notables.
Si DKMS n'installe pas automatiquement le paquet kernel-header, il faudra l'installer manuellement avec le gestionnaire de paquets de votre distribution.
Téléchargez sur votre ordinateur les deux fichiers suivants :
- NVIDIA-Linux-x86_64-580.105.08-grid.run
- kalpa-prod.tok
wget https://object-arbutus.alliancecan.ca/swift/v1/6c87c15eb7d2468daf3d2bd0c58bbfce/vgpu/NVIDIA-Linux-x86_64-580.105.08-grid.run
wget https://object-arbutus.alliancecan.ca/swift/v1/6c87c15eb7d2468daf3d2bd0c58bbfce/vgpu/kalpa-prod.tok
Installez le pilote pour vGPU de Nvidia avec :
Les options NVIDIA Proprietary et DKMS sont recommandées.
Quand votre installation réussit, redémarrez l'ordinateur et utilisez nvidia-smi pour vérifier si le système d'exploitation a bien accès au vGPU.
root@vgpudoc:/home/debian# nvidia-smi
Thu Apr 2 19:06:00 2026
+-----------------------------------------------------------------------------------------+
| NVIDIA-SMI 580.105.08 Driver Version: 580.105.08 CUDA Version: 13.0 |
+-----------------------------------------+------------------------+----------------------+
| GPU Name Persistence-M | Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap | Memory-Usage | GPU-Util Compute M. |
| | | MIG M. |
|=========================================+========================+======================|
| 0 NVIDIA H100L-1-12C On | 00000000:00:06.0 Off | On |
| N/A N/A P0 N/A / N/A | 1MiB / 12288MiB | N/A Default |
| | | Enabled |
+-----------------------------------------+------------------------+----------------------+
+-----------------------------------------------------------------------------------------+
| MIG devices: |
+------------------+----------------------------------+-----------+-----------------------+
| GPU GI CI MIG | Shared Memory-Usage | Vol| Shared |
| ID ID Dev | Shared BAR1-Usage | SM Unc| CE ENC DEC OFA JPG |
| | | ECC| |
|==================+==================================+===========+=======================|
| 0 0 0 0 | 1MiB / 10565MiB | 16 0 | 1 0 1 0 1 |
| | 0MiB / 4096MiB | | |
+------------------+----------------------------------+-----------+-----------------------+
+-----------------------------------------------------------------------------------------+
| Processes: |
| GPU GI CI PID Type Process name GPU Memory |
| ID ID Usage |
|=========================================================================================|
| No running processes found |
+-----------------------------------------------------------------------------------------+
Le vGPU est maintenant accessible et doit être licencié. Copiez le jeton kalpa-prod.tok vers /etc/nvidia/ClientConfigToken/.
Configurez nvidia-gridd via la commande ci-dessous :
Activez nvidia-gridd et vérifiez son statut.
nvidia-gridd.service - NVIDIA Grid Daemon
Loaded: loaded (/usr/lib/systemd/system/nvidia-gridd.service; enabled; preset: enabled)
Active: active (running) since Thu 2026-04-02 19:11:13 UTC; 19s ago
Invocation: 11dbb0370aee4ceeb1603481991037ec
Process: 836 ExecStart=/usr/bin/nvidia-gridd (code=exited, status=0/SUCCESS)
Main PID: 837 (nvidia-gridd)
Tasks: 4 (limit: 42042)
Memory: 2M (peak: 2.7M)
CPU: 307ms
CGroup: /system.slice/nvidia-gridd.service
ââ837 /usr/bin/nvidia-gridd
Apr 02 19:11:13 vgpudoc systemd[1]: Starting nvidia-gridd.service - NVIDIA Grid Daemon...
Apr 02 19:11:13 vgpudoc nvidia-gridd[837]: Started (837)
Apr 02 19:11:13 vgpudoc systemd[1]: Started nvidia-gridd.service - NVIDIA Grid Daemon.
Apr 02 19:11:13 vgpudoc nvidia-gridd[837]: vGPU Software package (0)
Apr 02 19:11:13 vgpudoc nvidia-gridd[837]: Ignore service provider and node-locked licensing
Apr 02 19:11:13 vgpudoc nvidia-gridd[837]: NLS initialized
Apr 02 19:11:14 vgpudoc nvidia-gridd[837]: Acquiring license. (Info: api.cls.licensing.nvidia.com; NVIDIA Virtual Compute Server)
Apr 02 19:11:16 vgpudoc nvidia-gridd[837]: License acquired successfully. (Info: api.cls.licensing.nvidia.com, NVIDIA Virtual Compute Server; Expiry: 2026-4-3 19:11:16 GMT)
Une fois que gridd a obtenu une licence valide, toutes les fonctionnalités du vGPU peuvent être utilisées. Le renouvellement des licences est géré automatiquement par nvidia-gridd.