(推荐)自动安装gpu加速型ecs的gpu驱动(linux)-九游平台
操作场景
在使用gpu加速型实例时,需确保实例已安装gpu驱动,否则无法获得相应的gpu加速能力。
本节内容介绍如何在gpu加速型linux实例上通过脚本自动安装gpu驱动。
使用须知
- 本操作仅支持linux操作系统。
- 本操作当前仅支持安装tesla驱动。
- 如果gpu加速型实例已安装gpu驱动,需要先卸载原驱动后再安装新的目标驱动。
gpu驱动自动安装脚本提供卸载驱动的能力,请在执行脚本时根据交互式界面按需选择。
- gpu驱动安装成功后,实例会自动重启。
- 仅部分linux公共镜像支持通过脚本自动安装gpu驱动,如下所示:
- centos 7.6、centos 7.9、centos 8.2。
- ubuntu 18.04、ubuntu 20.04、ubuntu22.04。
如果在支持的linux公共镜像中没有您需要的操作系统及版本,请参考手动安装gpu加速型ecs的tesla驱动,手动安装gpu驱动。
- 如果您使用的是私有镜像,请确保镜像已安装了cloud-init组件及安装gpu驱动所需的依赖,且需使用驱动脚本所支持的linux操作系统及版本。
- 请根据表1选择需要的驱动安装包版本。
表1 支持的gpu驱动版本 cuda软件版本
driver软件版本
cudnn软件版本
10.2
440.118.02
8.0.5
11.0
450.191.01
8.1.1
11.2
460.73.01
8.1.1
11.4
470.103.01
8.2.4
12.2
535.161.08
8.9.6.50
驱动安装脚本支持区域及获取方式
您可以通过执行以下命令,获取驱动安装脚本。
- 华北-北京一
wget -t 10 --timeout=10 https://hgcs-drivers-cn-north-1.obs.cn-north-1.myhuaweicloud.com/release/script/auto_install.sh && bash auto_install.sh
- 华北-北京二
wget -t 10 --timeout=10 https://hgcs-drivers-cn-north-2.obs.cn-north-2.myhuaweicloud.com/release/script/auto_install.sh && bash auto_install.sh
- 华北-北京四
wget -t 10 --timeout=10 https://hgcs-drivers-cn-north-4.obs.cn-north-4.myhuaweicloud.com/release/script/auto_install.sh && bash auto_install.sh
- 华北-乌兰察布一
wget -t 10 --timeout=10 https://hgcs-drivers-cn-north-9.obs.cn-north-9.myhuaweicloud.com/release/script/auto_install.sh && bash auto_install.sh
- 华东-上海一
wget -t 10 --timeout=10 https://hgcs-drivers-cn-east-3.obs.cn-east-3.myhuaweicloud.com/release/script/auto_install.sh && bash auto_install.sh
- 华东-上海二
wget -t 10 --timeout=10 https://hgcs-drivers-cn-east-2.obs.cn-east-2.myhuaweicloud.com/release/script/auto_install.sh && bash auto_install.sh
- 华南-广州
wget -t 10 --timeout=10 https://hgcs-drivers-cn-south-1.obs.cn-south-1.myhuaweicloud.com/release/script/auto_install.sh && bash auto_install.sh
- 华南-广州-友好用户环境
wget -t 10 --timeout=10 https://hgcs-drivers-cn-south-4.obs.cn-south-4.myhuaweicloud.com/release/script/auto_install.sh && bash auto_install.sh
- 西南-贵阳一
wget -t 10 --timeout=10 https://hgcs-drivers-cn-southwest-2.obs.cn-southwest-2.myhuaweicloud.com/release/script/auto_install.sh && bash auto_install.sh
- 中国-香港
wget -t 10 --timeout=10 https://hgcs-drivers-ap-southeast-1.obs.ap-southeast-1.myhuaweicloud.com/release/script/auto_install.sh && bash auto_install.sh
- 亚太-曼谷
wget -t 10 --timeout=10 https://hgcs-drivers-ap-southeast-2.obs.ap-southeast-2.myhuaweicloud.com/release/script/auto_install.sh && bash auto_install.sh
- 亚太-新加坡
wget -t 10 --timeout=10 https://hgcs-drivers-ap-southeast-3.obs.ap-southeast-3.myhuaweicloud.com/release/script/auto_install.sh && bash auto_install.sh
- 非洲-约翰内斯堡
wget -t 10 --timeout=10 https://hgcs-drivers-af-south-1.obs.af-south-1.myhuaweicloud.com/release/script/auto_install.sh && bash auto_install.sh
操作步骤
以下操作以ubuntu 20.04 64bit操作系统,p2v规格的gpu加速型实例安装cuda 11.0对应的tesla驱动为例进行介绍。
- 以root账号远程登录云服务器。
- 执行以下命令,获取驱动安装脚本并运行。
wget -t 10 --timeout=10 https://hgcs-drivers-cn-east-2.obs.cn-east-2.myhuaweicloud.com/release/script/auto_install.sh && bash auto_install.sh
- 根据界面提示,选择需要安装的驱动版本。
图1 选择驱动安装版本
- 卸载已安装驱动。
如果云服务器已安装过驱动,请根据提示先执行驱动卸载操作。
如果云服务器本身未安装驱动,脚本会自动跳过该步骤,开始进行驱动安装。
- 卸载cuda toolkit。
图2 卸载cuda toolkit(1)图3 卸载cuda toolkit(2)
- 卸载gpu driver。
图4 卸载gpu driver
卸载完成后,开始安装驱动,此过程会持续几分钟,请耐心等待。
- 卸载cuda toolkit。
- 驱动安装完成后,会自动重启云服务器后,请重新以root账号登录。
- 执行以下命令,检查驱动是否安装成功。
nvidia-smi
如果返回信息中包含了已安装的驱动版本,说明驱动安装成功。
图5 查看驱动安装结果 - 执行以下命令,检查cuda版本是否正确。
/usr/local/cuda/bin/nvcc -v
图6 检查cuda版本 - (可选)检查cuda是否正常。
- 执行以下命令,进入“/usr/local/cuda/samples/1_utilities/devicequery”目录。
cd /usr/local/cuda/samples/1_utilities/devicequery
- 执行以下命令,自动编译devicequery程序。
make
- 执行以下命令,查看cuda是否安装成功。
./devicequery
如果返回信息中有cuda的版本信息,则表明cuda安装成功。
图7 查看cuda安装结果
- 执行以下命令,进入“/usr/local/cuda/samples/1_utilities/devicequery”目录。
相关文档
意见反馈
文档内容是否对您有帮助?
如您有其它疑问,您也可以通过华为云社区问答频道来与我们联系探讨