vmware esxi 显卡直通模式验证及nvidia驱动安装
背景
物理机器有显卡L20 (4 * 48G),安装vmware esxi系统,希望虚拟机ubuntu22.04 直通物理显卡。
- ESXi-8.0U3e-24677879-standard
- ubuntu22.04
直通模式配置
虚拟机配置
- 创建虚拟机及配置参数- 预留全部内存 
- 在“虚拟机设置”中,点击“添加其他设备” > “PCI设备”,在列表中找到并勾选NVIDIA显卡(例如,0000:c1:00.0)。 
- 取消UEFI安全启动 
 
- 预留全部内存
为了优化GPU直通的性能和兼容性,需要在虚拟机的高级配置中添加以下参数:
| 1 | 该参数用于隐藏虚拟化环境,使得虚拟机能够更好地识别并利用NVIDIA显卡。 | 
pciPassthru.64bitMMIOSizeGB计算方式 https://earlruby.org/tag/use64bitmmio/
64bitMMIOSizeGB值的计算方法是将连接到VM的所有GPU上的显存总量(GB)相加。如果总显存为2的幂次方,则将pciPassthru.64bitMMIOSizeGB设置为下一个2的幂次方即可。
如果总显存介于2的2次方之间,则向上舍入到下一个2的幂次方,然后再次向上舍入。
2的幂数是2、4、8、16、32、64、128、256、512、1024…
例如虚拟机直通两张24G显存的显卡,则64bitMMIOSizeGB应设置为128。计算方式为242=48,在32和64之间,先舍入到64,再次舍入到128
例如虚拟机直通两张48G显存的显卡,则64bitMMIOSizeGB应设置为256。计算方式为482=96,在64和128之间,先舍入到128,再次舍入到256

linux 驱动安装
- 更新系统 1 sudo apt update && sudo apt upgrade -y 
- 禁用开源驱动 Nouveau保存后执行:1 
 2
 3
 4sudo nano /etc/modprobe.d/blacklist.conf 
 # 在文件末尾添加以下内容:
 blacklist nouveau
 options nouveau modeset=0重启后验证是否禁用成功(无输出即成功):1 
 2sudo update-initramfs -u 
 sudo reboot1 lsmod | grep nouveau 
- 安装驱动- 安装显卡驱动工具1 sudo apt-get install nvidia-cuda-toolkit 
- 查看系统推荐显卡驱动这里要看好哪个是系统推荐的驱动(recommend),并且要记下来 1 
 2
 3
 4
 5
 6
 7
 8
 9
 10
 11
 12
 13
 14
 15
 16
 17
 18
 19
 20
 21
 22
 23
 24
 25
 26
 27
 28sudo ubuntu-drivers devices 
 (base) root@ai-03-deploy:~# sudo ubuntu-drivers devices
 == /sys/devices/pci0000:00/0000:00:0f.0 ==
 modalias : pci:v000015ADd00000405sv000015ADsd00000405bc03sc00i00
 vendor : VMware
 model : SVGA II Adapter
 manual_install: True
 driver : open-vm-tools-desktop - distro free
 == /sys/devices/pci0000:03/0000:03:00.0 ==
 modalias : pci:v000010DEd000026BAsv000010DEsd00001957bc03sc02i00
 vendor : NVIDIA Corporation
 driver : nvidia-driver-535 - distro non-free
 driver : nvidia-driver-575-server-open - distro non-free
 driver : nvidia-driver-550-open - distro non-free
 driver : nvidia-driver-575-open - distro non-free
 driver : nvidia-driver-570 - distro non-free
 driver : nvidia-driver-550 - distro non-free
 driver : nvidia-driver-570-server-open - distro non-free
 driver : nvidia-driver-570-open - distro non-free
 driver : nvidia-driver-575 - distro non-free recommended
 driver : nvidia-driver-575-server - distro non-free
 driver : nvidia-driver-535-open - distro non-free
 driver : nvidia-driver-535-server-open - distro non-free
 driver : nvidia-driver-570-server - distro non-free
 driver : nvidia-driver-535-server - distro non-free
 driver : xserver-xorg-video-nouveau - distro free builtin
- 添加驱动源1 
 2sudo add-apt-repository ppa:graphics-drivers/ppa 
 sudo apt-get update
- 选择版本安装1 sudo apt install nvidia-driver-575 1 sudo reboot 
 
- 安装显卡驱动工具
- 验证安装1 
 2nvidia-smi 
 nvitop
参考链接
从坑中爬起:ESXi 8.0直通NVIDIA显卡的血泪经验
How To Install Nvidia Drivers on Rocky Linux 10
vmware虚拟机玩GPU显卡直通