开启 GPU/NPU 虚拟化后,单张物理 GPU/NPU 卡可被划分为多个独立的虚拟算力单元(vGPU/vNPU),每个单元具备专属的计算核心与显存资源。

虚拟化技术突破“一卡一任务”的传统限制,支持多任务并行共享同一硬件,大幅提升资源利用率,降低算力成本。同时,虚拟化实现了任务间的资源隔离与弹性调度,有效避免性能干扰,提升整体运行效率与资源管理灵活性。

说明

仅调度策略为整卡独占的 GPU/NPU 节点支持开启 GPU/NPU 虚拟化。

前提条件

  • 已部署算力节点。

  • KubeSphere 平台需要安装并启用算力设备管理扩展组件。

  • 您需要加入一个集群并在集群中具有算力节点管理权限。有关更多信息,请参阅集群成员集群角色

操作步骤

  1. 以具有算力节点管理权限的用户登录 KubeSphere Web 控制台并进入您的集群。

  2. 在左侧导航栏选择集群 > 算力节点

  3. 在需要操作的 GPU/NPU 节点右侧点击more,然后在下拉列表中选择开启 GPU/NPU 虚拟化

    操作完成后,算力节点页签下该节点的调度策略将从“整卡独占”变为“隔离共享”;vGPU/vNPU 节点页签下将显示节点信息。