« GPU Passthrough » : différence entre les versions

De Le Wiki de Lug
Aller à la navigation Aller à la recherche
(Page créée avec « = NVidia = == LXC == [https://matthieu.yiptong.ca/2020/12/06/nvidia-gpu-passthrough-to-lxc-containers-on-proxmox-6-for-nvenc-in-plex/ Source] [https://theorangeone.net/pos… »)
 
 
(9 versions intermédiaires par le même utilisateur non affichées)
Ligne 1 : Ligne 1 :
= NVidia =
= NVidia LXC =
== LXC ==
[https://matthieu.yiptong.ca/2020/12/06/nvidia-gpu-passthrough-to-lxc-containers-on-proxmox-6-for-nvenc-in-plex/ Source] [https://theorangeone.net/posts/lxc-nvidia-gpu-passthrough/ Autre source] [https://medium.com/@MARatsimbazafy/journey-to-deep-learning-nvidia-gpu-passthrough-to-lxc-container-97d0bc474957 Encore une autre]
[https://matthieu.yiptong.ca/2020/12/06/nvidia-gpu-passthrough-to-lxc-containers-on-proxmox-6-for-nvenc-in-plex/ Source] [https://theorangeone.net/posts/lxc-nvidia-gpu-passthrough/ Autre source] [https://medium.com/@MARatsimbazafy/journey-to-deep-learning-nvidia-gpu-passthrough-to-lxc-container-97d0bc474957 Encore une autre]
{{Méta bandeau
  | niveau = grave
  | icône = important
  | texte  = le pilote installé doit être identique sur l'hôte ProxMox et le conteneur LXC
}}
Sur le serveur ProxMox l'on peut installé DKMS pour ne pas perdre le module du pilote lorsque le kernel est mise à jour :
# apt update && apt upgrade
# apt install dkms
Se rendre sur [https://github.com/keylase/nvidia-patch ce site] et choisir un pilote compatible avec le patch pour supprimé la limite de sessions, télécharger l'ensemble sur le serveur et les containeurs :
{{Méta bandeau
  | niveau = information
  | icône = loupe
  | texte  = Astuce : Il est possible d'utiliser un '''[[Bindmount|montage interne]]''' pour partager les fichiers :
}}
Si nécessaire on installe git :
# apt install git
Puis on récupère les fichiers :
# mkdir /opt/nvidia-driver
# cd /opt/nvidia-driver/
# wget <nowiki>https://</nowiki>international.download.nvidia.com/XFree86/Linux-x86_64/<font color = green>470.74</font>/NVIDIA-Linux-x86_64-<font color = green>470.74</font>.run
# git clone <nowiki>https://</nowiki>github.com/keylase/nvidia-patch
Ensuite on commence par configurer ProxMox :
==ProxMox==
* On installe les prérequis si nécessaire :
proxmox:~# apt install pve-headers
* On installe le pilote :
proxmox:~# bash /opt/nvidia-driver/NVIDIA-Linux-x86_64-<font color = green>470.74</font>.run
----
Si nécessaire on demande à l'installateur de remplacer le pilote "nouveau" au démarrage :
[[Fichier:Nouveau nvidia.png|border|On ne veut plus de toi nouveau..]]
On le décharge :
proxmox:~# rmmod nouveau
On relance l'installation :
proxmox:~# bash /opt/nvidia-driver/NVIDIA-Linux-x86_64-<font color = green>470.74</font>.run
----
* On accepte d'enregistrer le module dans DKMS pour éviter de devoir le réinstaller lors de la mise à jour du kernel :
[[Fichier:Dkms.png|border|On accepte l'inscription dans DKMS..]]
{{Méta bandeau
  | niveau = information
  | icône = loupe
  | texte  = On conserve le choix par défaut pour les autres options demandées..
}}
*On applique le patch pour supprimer la limite de sessions :
proxmox:~# bash /opt/nvidia-driver/nvidia-patch/patch.sh
On peut également appliquer le patch pour autoriser "NvFBC" :
proxmox:~# bash /opt/nvidia-driver/nvidia-patch/patch-fbc.sh
* On force le chargement de modules au démarrage :
proxmox:~# vi /etc/modules-load.d/modules.conf
<font color = grey>...</font>
# Nvidia modules
nvidia
nvidia_uvm
proxmox:~# update-initramfs -u -k all
* On force la création de fichiers qui en utilisation normale ne sont créés qu'a la demande :
proxmox:~# vi /etc/udev/rules.d/70-nvidia.rules
KERNEL=="nvidia", RUN+="/bin/bash -c '/usr/bin/nvidia-smi -L && /bin/chmod 666 /dev/nvidia*'"
KERNEL=="nvidia_uvm", RUN+="/bin/bash -c '/usr/bin/nvidia-modprobe -c0 -u && /bin/chmod 0666 /dev/nvidia-uvm*'"
* On redémarre le serveur, on peut ensuite vérifier l'installation avec la commande "nvidia-smi"
proxmox:~# nvidia-smi
* Ensuite il faut noter le numéro du "cgroup" à autoriser pour le conteneur :
proxmox:~# ls -l /dev/nvidia*
crw-rw-rw- 1 root root <font color = blue>195</font>,  0 Oct 23 15:59 /dev/nvidia0
crw-rw-rw- 1 root root <font color = blue>195</font>, 255 Oct 23 15:59 /dev/nvidiactl
crw-rw-rw- 1 root root <font color = blue>510</font>,  0 Oct 23 15:59 /dev/nvidia-uvm
crw-rw-rw- 1 root root <font color = blue>510</font>,  1 Oct 23 15:59 /dev/nvidia-uvm-tools
On édite la configuration du conteneur LXC, ici pour exemple le conteneur "<font color = green>101</font>" :
proxmox:~# vi /etc/pve/lxc/<font color = green>101</font>.conf
# Allow cgroup access
lxc.<font color = green>cgroup2</font>.devices.allow: c <font color = blue>195</font>:* rwm
lxc.<font color = green>cgroup2</font>.devices.allow: c <font color = blue>510</font>:* rwm
# Pass through device files
lxc.mount.entry: /dev/nvidia0 dev/nvidia0 none bind,optional,create=file
lxc.mount.entry: /dev/nvidiactl dev/nvidiactl none bind,optional,create=file
lxc.mount.entry: /dev/nvidia-uvm dev/nvidia-uvm none bind,optional,create=file
lxc.mount.entry: /dev/nvidia-modeset dev/nvidia-modeset none bind,optional,create=file
lxc.mount.entry: /dev/nvidia-uvm-tools dev/nvidia-uvm-tools none bind,optional,create=file
{{Méta bandeau
  | niveau = information
  | icône = loupe
  | texte  = "<font color = green>cgroup'''2'''</font>" à partir de ProxMox 7, sinon utiliser "cgroup".
}}
= Conteneur LXC =
* Après avoir démarré ou redémarré le conteneur, on installe le pilote :
LXC:~# bash /opt/nvidia-driver/NVIDIA-Linux-x86_64-<font color = green>470.74</font>.run --no-kernel-module
* On installe le patch pour supprimer la limite de sessions :
LXC:~# bash /opt/nvidia-driver/nvidia-patch/patch.sh
Optionnelement on peut activer "NvFBC"
LXC:~# bash /opt/nvidia-driver/nvidia-patch/patch-fbc.sh
Et pour finir on vérifie l'installation avec la commande "nvidia-smi" :
LXC:~# nvidia-smi

Version actuelle datée du 29 octobre 2021 à 10:14

NVidia LXC

Source Autre source Encore une autre

Sur le serveur ProxMox l'on peut installé DKMS pour ne pas perdre le module du pilote lorsque le kernel est mise à jour :

# apt update && apt upgrade
# apt install dkms

Se rendre sur ce site et choisir un pilote compatible avec le patch pour supprimé la limite de sessions, télécharger l'ensemble sur le serveur et les containeurs :

Si nécessaire on installe git :

# apt install git

Puis on récupère les fichiers :

# mkdir /opt/nvidia-driver
# cd /opt/nvidia-driver/
# wget https://international.download.nvidia.com/XFree86/Linux-x86_64/470.74/NVIDIA-Linux-x86_64-470.74.run
# git clone https://github.com/keylase/nvidia-patch

Ensuite on commence par configurer ProxMox :

ProxMox

  • On installe les prérequis si nécessaire :
proxmox:~# apt install pve-headers
  • On installe le pilote :
proxmox:~# bash /opt/nvidia-driver/NVIDIA-Linux-x86_64-470.74.run

Si nécessaire on demande à l'installateur de remplacer le pilote "nouveau" au démarrage :

On ne veut plus de toi nouveau..

On le décharge :

proxmox:~# rmmod nouveau

On relance l'installation :

proxmox:~# bash /opt/nvidia-driver/NVIDIA-Linux-x86_64-470.74.run

  • On accepte d'enregistrer le module dans DKMS pour éviter de devoir le réinstaller lors de la mise à jour du kernel :

On accepte l'inscription dans DKMS..

  • On applique le patch pour supprimer la limite de sessions :
proxmox:~# bash /opt/nvidia-driver/nvidia-patch/patch.sh

On peut également appliquer le patch pour autoriser "NvFBC" :

proxmox:~# bash /opt/nvidia-driver/nvidia-patch/patch-fbc.sh
  • On force le chargement de modules au démarrage :
proxmox:~# vi /etc/modules-load.d/modules.conf
...
# Nvidia modules
nvidia
nvidia_uvm
proxmox:~# update-initramfs -u -k all
  • On force la création de fichiers qui en utilisation normale ne sont créés qu'a la demande :
proxmox:~# vi /etc/udev/rules.d/70-nvidia.rules
KERNEL=="nvidia", RUN+="/bin/bash -c '/usr/bin/nvidia-smi -L && /bin/chmod 666 /dev/nvidia*'"
KERNEL=="nvidia_uvm", RUN+="/bin/bash -c '/usr/bin/nvidia-modprobe -c0 -u && /bin/chmod 0666 /dev/nvidia-uvm*'"
  • On redémarre le serveur, on peut ensuite vérifier l'installation avec la commande "nvidia-smi"
proxmox:~# nvidia-smi
  • Ensuite il faut noter le numéro du "cgroup" à autoriser pour le conteneur :
proxmox:~# ls -l /dev/nvidia*
crw-rw-rw- 1 root root 195,   0 Oct 23 15:59 /dev/nvidia0
crw-rw-rw- 1 root root 195, 255 Oct 23 15:59 /dev/nvidiactl
crw-rw-rw- 1 root root 510,   0 Oct 23 15:59 /dev/nvidia-uvm
crw-rw-rw- 1 root root 510,   1 Oct 23 15:59 /dev/nvidia-uvm-tools

On édite la configuration du conteneur LXC, ici pour exemple le conteneur "101" :

proxmox:~# vi /etc/pve/lxc/101.conf
# Allow cgroup access
lxc.cgroup2.devices.allow: c 195:* rwm
lxc.cgroup2.devices.allow: c 510:* rwm

# Pass through device files
lxc.mount.entry: /dev/nvidia0 dev/nvidia0 none bind,optional,create=file
lxc.mount.entry: /dev/nvidiactl dev/nvidiactl none bind,optional,create=file
lxc.mount.entry: /dev/nvidia-uvm dev/nvidia-uvm none bind,optional,create=file
lxc.mount.entry: /dev/nvidia-modeset dev/nvidia-modeset none bind,optional,create=file
lxc.mount.entry: /dev/nvidia-uvm-tools dev/nvidia-uvm-tools none bind,optional,create=file

Conteneur LXC

  • Après avoir démarré ou redémarré le conteneur, on installe le pilote :
LXC:~# bash /opt/nvidia-driver/NVIDIA-Linux-x86_64-470.74.run --no-kernel-module
  • On installe le patch pour supprimer la limite de sessions :
LXC:~# bash /opt/nvidia-driver/nvidia-patch/patch.sh

Optionnelement on peut activer "NvFBC"

LXC:~# bash /opt/nvidia-driver/nvidia-patch/patch-fbc.sh

Et pour finir on vérifie l'installation avec la commande "nvidia-smi" :

LXC:~# nvidia-smi