k3s 节点重启后，GPU虚拟化失效，nvidia.com/gpu 数目变回物理GPU数目，重启pod hami-device-plugin后，nvidia.com/gpu 数目恢复正常 #829

christu · 2025-01-23T09:46:10Z

What happened:
k3s 节点重启后，GPU虚拟化失效，nvidia.com/gpu 数目变回物理GPU数目，重启pod hami-device-plugin后，nvidia.com/gpu 数目恢复正常

What you expected to happen:

How to reproduce it (as minimally and precisely as possible):

Anything else we need to know?:

Environment:

The text was updated successfully, but these errors were encountered:

archlitchi · 2025-01-24T07:26:56Z

你应该是之前没卸载掉nvidiade device-plugin吧

christu · 2025-02-08T09:01:39Z

你应该是之前没卸载掉nvidiade device-plugin吧

先安装的nvidia GPU Opeartor，再安装的Hami，安装完hami之后需要把 nvidia-device-plugin-daemonset 卸载掉吗？

archlitchi · 2025-02-08T10:17:30Z

你应该是之前没卸载掉nvidiade device-plugin吧

先安装的nvidia GPU Opeartor，再安装的Hami，安装完hami之后需要把 nvidia-device-plugin-daemonset 卸载掉吗？

是的，除非你用自定义的资源名

christu · 2025-02-10T02:09:20Z

好的，了解了，多谢！

christu · 2025-02-10T03:34:52Z

在安装 nvidia GPU Opeartor 之后，删除 nvidia-device-plugin-daemonset 的方法吗？尝试删除nvidia-device-plugin-daemonset ，但删除后就会重新创建

christu · 2025-02-10T06:05:18Z

你应该是之前没卸载掉nvidiade device-plugin吧

先安装的nvidia GPU Opeartor，再安装的Hami，安装完hami之后需要把 nvidia-device-plugin-daemonset 卸载掉吗？

是的，除非你用自定义的资源名

在安装 nvidia GPU Opeartor 之后，有删除 nvidia-device-plugin-daemonset 的方法吗？尝试删除nvidia-device-plugin-daemonset ，但删除后就会重新创建

w7team · 2025-02-12T15:13:47Z

关注一下这个问题。目前文档里没说要删掉nvidia-device-plugin-daemonset

christu added the kind/bug label Jan 23, 2025

w7team mentioned this issue Feb 13, 2025

关于安装NVIDIA gpu-operator后是否需要卸载nvidia-device-plugin-daemonset的问题 #864

Open

christu closed this as completed Feb 13, 2025

Provide feedback