/ 弹性云服务器 ecs/ / / t4 gpu设备显示异常
更新时间:2024-01-30 gmt 08:00

t4 gpu设备显示异常-九游平台

问题描述

使用nvidia tesla t4 gpu的云服务器,例如pi2或g6规格,执行nvidia-smi命令查看gpu使用情况时,显示如下:
no devices were found

原因分析

nvidia tesla t4 gpu是nvidia的新版本,默认使用并开启gsp firmware,导致gpu无法识别。

处理方法一

该处理方法在重启云服务器后失效。

  1. 执行以下命令,移除nvidia内核模块。

    rmmod nvidia_drm

    rmmod nvidia_modeset

    rmmod nvidia

  2. 执行以下命令,关闭gsp firmware开关,并载入nvidia内核模块。

    modprobe nvidia nvreg_enablegpufirmware=0

    modprobe nvidia_drm

    modprobe nvidia_modeset

  3. 如果问题依然存在,请联系客服。

处理方法二

  1. 执行以下命令,打开文件/etc/modprobe.d/nvidia.conf。

    vim /etc/modprobe.d/nvidia.conf

    单击“i”进入编辑模式。

  2. 在文件中添加以下内容。
    options nvidia nvreg_enablegpufirmware=0

    编辑完成后,单击esc键,并输入 :wq! 退出。

  3. 执行以下命令,重启云服务器。

    reboot

  4. 如果问题依然存在,请联系客服。

相关文档

网站地图