« GPU Passthrough » : différence entre les versions

De Le Wiki de Lug
Aller à la navigation Aller à la recherche
 
(4 versions intermédiaires par le même utilisateur non affichées)
Ligne 1 : Ligne 1 :
= NVidia =
= NVidia LXC =
[https://matthieu.yiptong.ca/2020/12/06/nvidia-gpu-passthrough-to-lxc-containers-on-proxmox-6-for-nvenc-in-plex/ Source] [https://theorangeone.net/posts/lxc-nvidia-gpu-passthrough/ Autre source] [https://medium.com/@MARatsimbazafy/journey-to-deep-learning-nvidia-gpu-passthrough-to-lxc-container-97d0bc474957 Encore une autre]
[https://matthieu.yiptong.ca/2020/12/06/nvidia-gpu-passthrough-to-lxc-containers-on-proxmox-6-for-nvenc-in-plex/ Source] [https://theorangeone.net/posts/lxc-nvidia-gpu-passthrough/ Autre source] [https://medium.com/@MARatsimbazafy/journey-to-deep-learning-nvidia-gpu-passthrough-to-lxc-container-97d0bc474957 Encore une autre]
{{Méta bandeau
{{Méta bandeau
Ligne 15 : Ligne 15 :
   | texte  = Astuce : Il est possible d'utiliser un '''[[Bindmount|montage interne]]''' pour partager les fichiers :
   | texte  = Astuce : Il est possible d'utiliser un '''[[Bindmount|montage interne]]''' pour partager les fichiers :
  }}
  }}
Si nécessaire on install git :
Si nécessaire on installe git :
  # apt install git
  # apt install git
Puis on récupère les fichiers :
Puis on récupère les fichiers :
Ligne 78 : Ligne 78 :


  # Allow cgroup access
  # Allow cgroup access
  lxc.cgroup.devices.allow: c <font color = blue>195</font>:* rwm
  lxc.<font color = green>cgroup2</font>.devices.allow: c <font color = blue>195</font>:* rwm
  lxc.cgroup.devices.allow: c <font color = blue>510</font>:* rwm
  lxc.<font color = green>cgroup2</font>.devices.allow: c <font color = blue>510</font>:* rwm
   
   
  # Pass through device files
  # Pass through device files
Ligne 87 : Ligne 87 :
  lxc.mount.entry: /dev/nvidia-modeset dev/nvidia-modeset none bind,optional,create=file
  lxc.mount.entry: /dev/nvidia-modeset dev/nvidia-modeset none bind,optional,create=file
  lxc.mount.entry: /dev/nvidia-uvm-tools dev/nvidia-uvm-tools none bind,optional,create=file
  lxc.mount.entry: /dev/nvidia-uvm-tools dev/nvidia-uvm-tools none bind,optional,create=file
{{Méta bandeau
  | niveau = information
  | icône = loupe
  | texte  = "<font color = green>cgroup'''2'''</font>" à partir de ProxMox 7, sinon utiliser "cgroup".
}}


= Conteneur LXC =
= Conteneur LXC =
* Après avoir démarré ou redémarré le conteneur, on install le pilote :
* Après avoir démarré ou redémarré le conteneur, on installe le pilote :
  LXC:~# bash /opt/nvidia-driver/NVIDIA-Linux-x86_64-<font color = green>470.74</font>.run --no-kernel-module
  LXC:~# bash /opt/nvidia-driver/NVIDIA-Linux-x86_64-<font color = green>470.74</font>.run --no-kernel-module
* On installe le patch pour supprimer la limite de sessions :
* On installe le patch pour supprimer la limite de sessions :

Version actuelle datée du 29 octobre 2021 à 10:14

NVidia LXC

Source Autre source Encore une autre

Sur le serveur ProxMox l'on peut installé DKMS pour ne pas perdre le module du pilote lorsque le kernel est mise à jour :

# apt update && apt upgrade
# apt install dkms

Se rendre sur ce site et choisir un pilote compatible avec le patch pour supprimé la limite de sessions, télécharger l'ensemble sur le serveur et les containeurs :

Si nécessaire on installe git :

# apt install git

Puis on récupère les fichiers :

# mkdir /opt/nvidia-driver
# cd /opt/nvidia-driver/
# wget https://international.download.nvidia.com/XFree86/Linux-x86_64/470.74/NVIDIA-Linux-x86_64-470.74.run
# git clone https://github.com/keylase/nvidia-patch

Ensuite on commence par configurer ProxMox :

ProxMox

  • On installe les prérequis si nécessaire :
proxmox:~# apt install pve-headers
  • On installe le pilote :
proxmox:~# bash /opt/nvidia-driver/NVIDIA-Linux-x86_64-470.74.run

Si nécessaire on demande à l'installateur de remplacer le pilote "nouveau" au démarrage :

On ne veut plus de toi nouveau..

On le décharge :

proxmox:~# rmmod nouveau

On relance l'installation :

proxmox:~# bash /opt/nvidia-driver/NVIDIA-Linux-x86_64-470.74.run

  • On accepte d'enregistrer le module dans DKMS pour éviter de devoir le réinstaller lors de la mise à jour du kernel :

On accepte l'inscription dans DKMS..

  • On applique le patch pour supprimer la limite de sessions :
proxmox:~# bash /opt/nvidia-driver/nvidia-patch/patch.sh

On peut également appliquer le patch pour autoriser "NvFBC" :

proxmox:~# bash /opt/nvidia-driver/nvidia-patch/patch-fbc.sh
  • On force le chargement de modules au démarrage :
proxmox:~# vi /etc/modules-load.d/modules.conf
...
# Nvidia modules
nvidia
nvidia_uvm
proxmox:~# update-initramfs -u -k all
  • On force la création de fichiers qui en utilisation normale ne sont créés qu'a la demande :
proxmox:~# vi /etc/udev/rules.d/70-nvidia.rules
KERNEL=="nvidia", RUN+="/bin/bash -c '/usr/bin/nvidia-smi -L && /bin/chmod 666 /dev/nvidia*'"
KERNEL=="nvidia_uvm", RUN+="/bin/bash -c '/usr/bin/nvidia-modprobe -c0 -u && /bin/chmod 0666 /dev/nvidia-uvm*'"
  • On redémarre le serveur, on peut ensuite vérifier l'installation avec la commande "nvidia-smi"
proxmox:~# nvidia-smi
  • Ensuite il faut noter le numéro du "cgroup" à autoriser pour le conteneur :
proxmox:~# ls -l /dev/nvidia*
crw-rw-rw- 1 root root 195,   0 Oct 23 15:59 /dev/nvidia0
crw-rw-rw- 1 root root 195, 255 Oct 23 15:59 /dev/nvidiactl
crw-rw-rw- 1 root root 510,   0 Oct 23 15:59 /dev/nvidia-uvm
crw-rw-rw- 1 root root 510,   1 Oct 23 15:59 /dev/nvidia-uvm-tools

On édite la configuration du conteneur LXC, ici pour exemple le conteneur "101" :

proxmox:~# vi /etc/pve/lxc/101.conf
# Allow cgroup access
lxc.cgroup2.devices.allow: c 195:* rwm
lxc.cgroup2.devices.allow: c 510:* rwm

# Pass through device files
lxc.mount.entry: /dev/nvidia0 dev/nvidia0 none bind,optional,create=file
lxc.mount.entry: /dev/nvidiactl dev/nvidiactl none bind,optional,create=file
lxc.mount.entry: /dev/nvidia-uvm dev/nvidia-uvm none bind,optional,create=file
lxc.mount.entry: /dev/nvidia-modeset dev/nvidia-modeset none bind,optional,create=file
lxc.mount.entry: /dev/nvidia-uvm-tools dev/nvidia-uvm-tools none bind,optional,create=file

Conteneur LXC

  • Après avoir démarré ou redémarré le conteneur, on installe le pilote :
LXC:~# bash /opt/nvidia-driver/NVIDIA-Linux-x86_64-470.74.run --no-kernel-module
  • On installe le patch pour supprimer la limite de sessions :
LXC:~# bash /opt/nvidia-driver/nvidia-patch/patch.sh

Optionnelement on peut activer "NvFBC"

LXC:~# bash /opt/nvidia-driver/nvidia-patch/patch-fbc.sh

Et pour finir on vérifie l'installation avec la commande "nvidia-smi" :

LXC:~# nvidia-smi