您好，我有一个i5-12600K的cpu，我安装了proxmox，并且安装了windows虚拟机，我...

Question

您好，我有一个i5-12600K的cpu，我安装了proxmox，并且安装了windows虚拟机，我想在windows虚拟机中使用这个cpu的核显做转码之类的工作，但是我也不想把这个核显直通给windows系统，我听说Sriov可以达到类似的效果，是这样吗？

Answer 1

是的，在 Alder Lake（第 12 代）CPU 的核显（Intel UHD 770 / Iris Xe-LP）上，确实可以用 SR-IOV vGPU 来把同一颗 iGPU 切成最多 7 个 VF（Virtual Function）分配给不同虚拟机，从而在 Windows VM 里获得 Quick Sync 编解码、DirectX 加速等能力，同时宿主机仍然保留对物理函数（PF）的控制，而不必整块直通。下面把原理、准备条件、具体做法和常见坑一次说清。

1 SR-IOV 与传统直通 / GVT-g 的区别

方案	占用方式	宿主还能用 iGPU？	最新内核支持	典型场景
直通（VFIO）	整个 00:02.0 设备	❌ 否	✅	单一高负载 VM
GVT-g	软件调度	✅ 是	❌（5.15 后官方移除）	老平台临时兼容
SR-IOV	硬件级多函数 (PF+VF)	✅ 是	✅（≥ 6.1，需 i915-sriov 补丁）	多 VM 共享编解码/轻量 3D

SR-IOV 在 12 代桌面 iGPU 上已正式硬件封装，理论性能接近原生，同时隔离性比 GVT-g 更好，也不会把宿主的显存全部让出。us.dfi.com

2 成功的前提检查

主板/BIOS
- 开启 VT-d / IOMMU、SR-IOV（不同厂商有时藏在 Advanced → PCIe 或 Re-BAR 菜单里）。若 BIOS 根本没有 SR-IOV 开关，则无法生成 VF——不少 Gigabyte B760/Z690 用户遇到同样难题。forum.proxmox.com
Proxmox VE ≥ 8（或 7.4+），并更新到 6.1 或更高内核。
i915-sriov-dkms 驱动（强制加载 SR-IOV 支持补丁）。官方内核暂未合并，需自己 dkms install；GitHub 项目 PVE-Intel-vGPU 提供一键脚本。github.com
GRUB 启动参数
```
bash
intel_iommu=on iommu=pt i915.enable_guc=3 i915.max_vfs=7
```
（max_vfs 决定可生成的 VF 数量，核显最多 7。）proxmoxcentral.com

sysfsutils 把 VF 常驻：

bash
echo "devices/pci0000:00/0000:00:02.0/sriov_numvfs = 7" \
  > /etc/sysfs.conf

重启后验证
```
bash
lspci | grep VGA
```
应看到 00:02.0（PF）+ 00:02.1-00:02.7（VF）。

3 把 VF 分给 Windows VM

在 Proxmox “Hardware” → “Add” → PCI Device，选择 00:02.x 中的某个 VF，勾选 Primary GPU/All Functions。
VM 显示设为 none，BIOS/Ovmf 固件保持默认。
安装 Intel Windows 驱动 ≥ 31.0.101.4972；设备管理器里会识别为 Intel(R) Graphics SR-IOV。community.intel.com
在 ffmpeg、HandBrake、Plex 等软件里选用 QSV / Video Acceleration，即可在 VM 内硬件转码。

⚠️ 如果 VM 里要捕获桌面做远程串流（Parsec/Sunshine），目前部分驱动版本仍有采集失败的 bug，需要等 Intel 后续驱动或用普通直通作为替代。community.intel.com

4 常见陷阱与限制

症状	可能原因 / 解决办法
看不到 SR-IOV 选项	主板 BIOS 不支持，或需更新到最新版本。部分消费级板子即使 CPU 支持也锁掉了此功能。
`lspci` 只有 00:02.0	没有写入 `i915.max_vfs` / `sriov_numvfs`，或未装 `i915-sriov-dkms`。
Proxmox 升级后 VF 消失	新内核替换了 DKMS 模块；重新 `dkms install` 并重建 initramfs。
性能不足	核显本身 EU 较少，7 个 VF 同时高负载时会互相争资源；用作 1080p/4K Plex 转码一般没问题，重度 3D 建议独显。
Windows 驱动报错 43	驱动版本太旧或 Secure Boot 未关闭；先禁掉 Secure Boot，再换最新驱动。

5 如果 SR-IOV 实在不可用，可以考虑…

整块直通 核显给 Windows，再给宿主机挂一张廉价独显／USB-VGA 适配器用于控制台；
在 Linux 宿主 或 LXC 内跑 Jellyfin/Plex，用 Quick Sync 转码，把媒体通过 SMB/NFS 共享给 Windows；
使用 软解 / VA-API 在宿主端完成转码，仅把成品流推给 VM。

结语

对 i5-12600K 而言，只要主板 BIOS 肯放行 SR-IOV，按上面步骤配置好 Proxmox + i915-sriov，就能在 Windows VM 里用核显做高效转码，而宿主机和其他 VM 依旧能共享这颗 GPU。一旦成功，体验与传统直通几乎一致，但灵活性更高，值得尝试。祝你折腾顺利！

Answer 2

结论先行：在 Hyper-V 里使用 GPU-P（GPU Partitioning / Paravirtualization）把物理 NVIDIA 显卡“分片”给 Linux 虚拟机后，Guest 系统可以安装 CUDA Toolkit 并直接调用 nvcc 编译、运行 CUDA 程序——前提是你按下列步骤把专用驱动、dxgkrnl 内核模块和用户态 CUDA 库都准备齐全，并且 Host 端的显卡在微软列出的可分区名单**之内。官方 Windows Server 2025 文档已明确把“AI/ML 推理”等 Compute 场景列为 GPU-P 支持对象，社区实践也验证了 nvidia-smi 和 nvcc --version 在 Ubuntu / Debian Guest 中正常工作。learn.microsoft.com learn.microsoft.com github.com forum.level1techs.com

1 GPU-P 与能否用 nvcc 的关系

1.1 机制简介

GPU-P 通过 SR-IOV 在硬件层面把一张 GPU 划成多个 partition，Guest 里呈现为 “Virtual Render Device”。Host 仍掌握物理驱动，Guest 只需加载 dxgkrnl 微内核模块 + 用户态驱动即可。learn.microsoft.com learn.microsoft.com
PowerShell 暴露了 Set-VMHostPartitionableGpu / Add-VMGpuPartitionAdapter 等命令，可单独设置 Compute/Encode/Decode/VRAM 份额；Min/Max/OptimalPartitionCompute 字段直接对应 CUDA 计算资源。learn.microsoft.com

1.2 官方“Compute 场景”定位

微软驱动文档把 “Compute (AI, ML, etc.)” 和 “Running Linux in a VM with GPU acceleration” 列为 GPU-P 的核心用途，意味着 CUDA 类工作负载在技术路线图内。learn.microsoft.com

2 满足哪些条件才能装 nvcc

环节	最低要求	关键资料
Host-OS	Windows 11 22H2 / Windows Server 2025（含 Hyper-V）	GPU-P 全功能仅在新内核启用learn.microsoft.com
GPU	NVIDIA A 系列 / L 系列等“Partitionable”型号；消费级卡需走社区脚本	learn.microsoft.com forum.level1techs.com
Guest-OS	Ubuntu 18.04/20.04/22.04 LTS 或任意 6.1+ Linux 内核（需自编译模块）	learn.microsoft.com github.com
内核模块	`dxgkrnl`（WSL 内核同源）+ `vmbus_ioctl`	社区脚本一键编译github.com
用户态驱动	将 Host 的 `libcuda.so`, `libnvidia-ptxjitcompiler.so` 等复制到 Guest，或直接用 Ubuntu-WSL CUDA 仓库	github.com forum.level1techs.com
CUDA Toolkit	安装 `cuda-toolkit-12-x-ubuntu-wsl`（或对应发行版）后即带 `nvcc`	docs.nvidia.com documentation.ubuntu.com github.com

提示：若使用官方 Server 2025 + A 系列卡组合，Windows Admin Center 可全图形化分区并自动在 Guest 注入驱动；社区方案则需自己复制 DLL/so 并编译 DKMS 模块。learn.microsoft.com forum.level1techs.com

3 实操流程（精简版）

在 Host 分区 GPU

powershell
# 以 4 片为例
Set-VMHostPartitionableGpu -InstanceId <GPU_ID> -PartitionCount 4
Add-VMGpuPartitionAdapter -VMName "UbuntuVM"
Set-VMGpuPartitionAdapter -VMName "UbuntuVM" -OptimalPartitionCompute 50GB

查看可调资源：Get-VMPartitionableGpu.learn.microsoft.com

Guest 侧安装 dxgkrnl

bash
git clone https://github.com/staralt/dxgkrnl-dkms
sudo ./install.sh
sudo reboot
dmesg | grep -i dxg  # 确认加载
```[github.com](https://github.com/Nislaco/Linux-GPU-V-Scripts-for-Hyper-V)

复制/安装 NVIDIA 用户态驱动
- 官方方式：sudo apt install nvidia-driver-535（或 Host 同版本）后运行 nvidia-smi。
- WSL-variant：sudo apt install cuda-toolkit-12-4-ubuntu-wsl。docs.nvidia.com documentation.ubuntu.com

验证

bash
nvidia-smi                 # 查看分区 GPU
nvcc --version             # 确认 CUDA 工具链

社区文章的 Step 12 已在 Ubuntu 24.04 VM 中成功执行并通过 nvcc --version 验证。github.com ubackup.com

4 已知限制与坑

一台 VM 只能挂 1 片，不能显式选择哪一片，由 Hyper-V 自动分配。learn.microsoft.com
驱动升级依赖 Host：Host 更新 GPU 驱动后需把新版本 DLL/so 再次拷进 Guest，否则出现 Code 43 / NVML block。forum.level1techs.com
显存 / Compute 份额固定，暂无法热调；重划分需停机。
性能：数据传输仍走 VMBus，低延迟任务（显式 P2P）效果不如 DDA 直通；但推理、训练小模型及 NVENC 转码性能与原生约 90-95%。forum.level1techs.com
GPU 型号限制：目前官方名单以 A/L 系列数据中心卡为主，消费级 RTX 30/40 在社区脚本里可用但“灰色支持”。learn.microsoft.com forum.level1techs.com

5 若 GPU-P 不可行的备选方案

方案	特点	适用场景
DDA (Discrete Device Assignment)	整卡直通、满血 CUDA；Host 不可再用该卡	单一重负载 VM，需硬件 & BIOS 支持
WSL 2	微软官方支持 CUDA、nvcc；无需新建独立 VM	在 Windows 上直接跑 Linux 工具链/容器
传统双系统 / Proxmox SR-IOV	更自由，但需重启或额外管理	极限性能或多卡复杂拓扑

小结

只要满足 支持 GPU-P 的硬件 + Server 2025/Win 11 Host + 6.1+ Linux Guest + dxgkrnl 驱动 + WSL-风味 CUDA Toolkit 这几个条件，你完全可以在 Hyper-V Linux 虚拟机里执行 nvcc 编译、运行 CUDA 程序。对轻量科研、推理或编码工作来说，这种方案兼顾了 安全隔离 + 资源共享，值得一试。祝你折腾顺利!

Answer 3

在 Debian 12 (Bookworm) 上，你可以只安装 CUDA Toolkit（即 nvcc 编译器及相关头文件/库）而完全不拉取或编译 NVIDIA 内核驱动。下面给出三种常见做法，按“稳定、官方仓库最简捷 → 最新版本 → 离线 Runfile”排列，你可以按需求任选其一。

简明要点

官方 Debian 仓库直接提供 nvidia-cuda-toolkit 包，安装即得 nvcc，不依赖内核驱动；缺点是版本停留在 11.8.x packages.debian.org。
NVIDIA 官方 APT 仓库可以装到 12.x 系列（如 12.5），通过单独的 cuda-toolkit-12-5（或其他版本号）元包实现“仅工具链”安装，不会把驱动拉进来docs.nvidia.com idroot.us。
Runfile 离线安装支持 --toolkit + --no-install-driver 等参数，只解压 Toolkit 部分，适合无法联网或需要自定义路径的场景docs.nvidia.com。
编译 CUDA 程序只需 Toolkit；运行时才需要内核驱动和兼容 GPU，如你只是交叉编译或做 PTX 研究，可完全不装驱动packages.debian.org wiki.debian.org。

方法 1：使用 Debian 官方仓库（最简单，版本 11.8）

bash
sudo apt update
sudo apt install nvidia-cuda-toolkit

该包位于 non-free 组件，当前 Bookworm 版本为 11.8.89，自带 nvcc、cuda-memcheck 等开发工具packages.debian.org。
安装后可直接验证：

bash
nvcc --version

Toolkit 文件默认在 /usr/lib/cuda（可通过 dpkg -L nvidia-cuda-toolkit | head 查看）。

方法 2：使用 NVIDIA 官方 APT 仓库（可获得 12.x 最新）

导入密钥并写入源

bash
sudo apt-get install gnupg ca-certificates curl
curl -fsSL https://developer.download.nvidia.com/compute/cuda/repos/debian12/x86_64/cuda-keyring_1.1-1_all.deb -o cuda-keyring.deb
sudo dpkg -i cuda-keyring.deb
sudo apt update

NVIDIA 的仓库为每个版本提供独立的 toolkit-only 元包（cuda-toolkit-12-5、cuda-command-line-tools-12-5 等）docs.nvidia.com docs.nvidia.com。

仅安装 Toolkit（无驱动）

bash
# 完整桌面/示例 + 文档
sudo apt install cuda-toolkit-12-5

# 最小化：只装编译相关
sudo apt install cuda-command-line-tools-12-5

由于这些包 不依赖 cuda-drivers，因此不会触发 DKMS 或内核编译流程docs.nvidia.com。

配置环境变量（若脚本未自动写入）

bash
echo 'export PATH=/usr/local/cuda-12.5/bin:$PATH' | sudo tee /etc/profile.d/cuda.sh
echo 'export LD_LIBRARY_PATH=/usr/local/cuda-12.5/lib64:$LD_LIBRARY_PATH' | sudo tee -a /etc/profile.d/cuda.sh
source /etc/profile
nvcc --version     # 检查

若要切换 Toolkit 版本，只需改动路径，互不冲突forums.developer.nvidia.com。

方法 3：离线 Runfile（自定义路径 / 无网络）

下载 Runfile

bash
wget https://developer.download.nvidia.com/compute/cuda/12.5.0/local_installers/cuda_12.5.0_555.42.02_linux.run

仅解压 Toolkit，跳过驱动
```
bash
sudo sh cuda_12.5.0_555.42.02_linux.run \
     --silent --toolkit --samples --no-install-driver
```
--toolkit 只安 Toolkit；--no-install-driver 明确禁用驱动安装docs.nvidia.com。

手动设环境

bash
export PATH=/usr/local/cuda-12.5/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-12.5/lib64:$LD_LIBRARY_PATH

常见问题

问题	解决办法
`nvcc: command not found`	检查 `PATH` 是否包含 `/usr/local/cuda-*/bin`；官方 FAQ 已给出示例docs.nvidia.com。
想并存多版本 Toolkit	不同版本安装在 `/usr/local/cuda-11.x/`, `/usr/local/cuda-12.x/`，通过环境变量切换即可docs.nvidia.com。
编译成功但运行报“找不到 GPU 驱动”	说明确实缺少 NVIDIA 内核驱动；如果只是交叉编译可忽略，否则需安装与 Toolkit 兼容版本的 `nvidia-driver` 后再运行（编译阶段仍无需）wiki.debian.org。

结语

在 Debian 12 上，只要 nvidia-cuda-toolkit 或 cuda-toolkit-12-x 安装成功并配置好环境变量，就能立即使用 nvcc 进行 CUDA 开发，无需任何驱动或 DKMS 步骤。选择 Debian 自带 包更省事，选择 NVIDIA 官方仓库 或 Runfile 则能拿到最新版 Toolkit；两者安装逻辑相互独立，你可根据需求灵活切换。祝编译顺利!

Answer 4

完全可以，但要谨慎操作：先 备份数据、确认有 Live USB 可在根分区未挂载时动刀，再停用并删除 sda3 （Swap），最后把新增的 20 GiB 扩展到 sda2 并扩大文件系统；需要的话，再用 swap file 或新分区重建交换分区。下面按 GUI（GParted Live）与纯命令行两条路径给出步骤，并指出 GPT / MBR、在线扩容、备份等注意事项。

1 前置检查与准备

1.1 确认分区布局

bash
lsblk -f
sudo fdisk -l /dev/sda

确认 /dev/sda2 为 ext4 根分区，/dev/sda3 为 swap，其后有未分配空间。Debian 12 默认 ext4 在线扩容受内核支持，但 调整分区表仍需在未挂载状态。itslinuxfoss.com

1.2 备份 & Live 媒体

建议用 Clonezilla / Timeshift 做整盘或至少根分区备份。unix.stackexchange.com
准备 GParted Live 或 Debian 12 安装盘的 “Rescue Mode”，以便从 USB 启动让 sda2 不被挂载。fosslinux.com

1.3 关闭并卸载交换分区

bash
sudo swapoff -a          # 临时停用所有 swap

停用后才能删除 sda3，否则分区忙。askubuntu.com

2 方法 A：GParted Live（图形界面）

从 Live USB 启动，打开 GParted。
右键 /dev/sda3 → Delete，将交换分区变为 “unallocated”。
右键 /dev/sda2 → Resize/Move
- 把 结束柱拉到盘尾，或手动 +20 GiB。
Apply（此时 GParted 先移动分区表，再在线扩容 ext4）。
可选：
- 在剩余空间里新建更小的 swap（如 4 GiB），文件系统类型选 linux-swap；
- 或稍后在系统里用 swap file 代替。

GParted 会自动调用 resize2fs 完成文件系统扩容。2daygeek.com unix.stackexchange.com

3 方法 B：纯命令行（growpart + resize2fs）

适合 KVM/VMware 等云主机或仅能 SSH 的环境。

3.1 安装工具（Live 环境或单用户模式）

bash
sudo apt update
sudo apt install cloud-guest-utils   # 提供 growpart

basezap.com

3.2 删除 swap 分区

bash
sudo fdisk /dev/sda
# d 3   → 删除分区 3
# w     → 写入并退出

（GPT 用 gdisk; MBR 用 fdisk; 同理可用 parted。）unix.stackexchange.com

3.3 扩大根分区边界

bash
sudo growpart /dev/sda 2   # 把 sda2 填满磁盘

growpart 会修改分区表并自动刷新内核表（若提示 “reboot required”，重启后继续）。sfitpro.blogspot.com

3.4 扩大 ext4 文件系统

bash
sudo resize2fs /dev/sda2   # 在线扩容，耗时取决于容量

resize2fs 支持挂载状态下扩大 ext4；无需 umount。askubuntu.com unix.stackexchange.com

4 重新配置 Swap（可选）

交换分区并非必须；现代系统推荐 swap file，更灵活。

bash
sudo fallocate -l 4G /swapfile
sudo chmod 600 /swapfile
sudo mkswap /swapfile
sudo swapon /swapfile
echo '/swapfile none swap sw 0 0' | sudo tee -a /etc/fstab

swap file 与分区等效且可随时调整大小。ivanmosquera.net

5 注意事项 & 常见坑

问题	说明 / 解决
分区表类型	MBR 主分区只能有 4 个；若 sda3 属于扩展分区逻辑驱动器，需先调整扩展分区边界。unix.stackexchange.com
在线扩容失败	内核过旧或文件系统有错误；先 `fsck -f /dev/sda2` 于未挂载状态再重试。tzulo.com
系统无法启动	GRUB 仍在 sda 首扇区，不受影响；如分区 UUID 变化，请更新 `/etc/fstab` 中 swap 行。askubuntu.com
growpart 命令不存在	确认 `cloud-guest-utils` 已安装。computingforgeeks.com

6 小结

停用 & 删除 sda3 → 扩大 sda2 → resize2fs →（可选）新建 swap 即可把未分配的 ~20 GiB 并入根分区。
图形 GParted 更直观、适合 Live USB；CLI 方案 (fdisk + growpart + resize2fs) 对远程服务器友好。
全程务必备份，并确保在断电风险低的环境中操作。祝你扩容顺利!

Frage

Gedanke

Explaining SR-IOV Setup

Antwort

1 SR-IOV 与传统直通 / GVT-g 的区别

2 成功的前提检查

3 把 VF 分给 Windows VM

4 常见陷阱与限制

5 如果 SR-IOV 实在不可用，可以考虑…

结语

Frage

Gedanke

Antwort

1 GPU-P 与能否用 nvcc 的关系

1.1 机制简介

1.2 官方“Compute 场景”定位

2 满足哪些条件才能装 nvcc

3 实操流程（精简版）

4 已知限制与坑

5 若 GPU-P 不可行的备选方案

小结

Frage

Gedanke

Antwort

简明要点

方法 1：使用 Debian 官方仓库（最简单，版本 11.8）

方法 2：使用 NVIDIA 官方 APT 仓库（可获得 12.x 最新）

方法 3：离线 Runfile（自定义路径 / 无网络）

常见问题

结语

Frage

Gedanke

Finalizing search for citations

Antwort

1 前置检查与准备

1.1 确认分区布局

1.2 备份 & Live 媒体

1.3 关闭并卸载交换分区

2 方法 A：GParted Live（图形界面）

3 方法 B：纯命令行（growpart + resize2fs）

3.1 安装工具（Live 环境或单用户模式）

3.2 删除 swap 分区

3.3 扩大根分区边界

3.4 扩大 ext4 文件系统

4 重新配置 Swap（可选）

5 注意事项 & 常见坑

6 小结

Diesen Q&A teilen