更新时间:2024-01-30 gmt 08:00
t4 gpu设备显示异常-九游平台
问题描述
使用nvidia tesla t4 gpu的云服务器,例如pi2或g6规格,执行nvidia-smi命令查看gpu使用情况时,显示如下:
no devices were found
原因分析
nvidia tesla t4 gpu是nvidia的新版本,默认使用并开启gsp firmware,导致gpu无法识别。
处理方法一

该处理方法在重启云服务器后失效。
- 执行以下命令,移除nvidia内核模块。
rmmod nvidia_drm
rmmod nvidia_modeset
rmmod nvidia
- 执行以下命令,关闭gsp firmware开关,并载入nvidia内核模块。
modprobe nvidia nvreg_enablegpufirmware=0
modprobe nvidia_drm
modprobe nvidia_modeset
- 如果问题依然存在,请联系客服。
处理方法二
- 执行以下命令,打开文件/etc/modprobe.d/nvidia.conf。
vim /etc/modprobe.d/nvidia.conf
单击“i”进入编辑模式。
- 在文件中添加以下内容。
options nvidia nvreg_enablegpufirmware=0
编辑完成后,单击esc键,并输入 :wq! 退出。
- 执行以下命令,重启云服务器。
reboot
- 如果问题依然存在,请联系客服。
父主题:
相关文档
意见反馈
文档内容是否对您有帮助?
提交成功!非常感谢您的反馈,我们会继续努力做到更好!
您可在查看反馈及问题处理状态。
系统繁忙,请稍后重试
如您有其它疑问,您也可以通过华为云社区问答频道来与我们联系探讨