更新时间:2022-12-09 gmt 08:00
在notebook中,如何使用昇腾多卡进行调试?-九游平台
昇腾多卡训练任务是多进程多卡模式,跑几卡需要起几个python进程。昇腾底层会读取环境变量:rank_table_file,开发环境已经设置,用户无需关注。比如跑八卡,可以如下片段代码:
export rank_size=8 current_exec_path=$(pwd) echo 'start training' for((i=0;i<=$rank_size-1;i )); do echo 'start rank '$i mkdir ${current_exec_path}/device$i cd ${current_exec_path}/device$i echo $i export rank_id=$i dev=`expr $i 0` echo $dev export device_id=$dev python train.py > train.log 2>&1 & done
其中,train.py中设置环境变量device_id:
devid = int(os.getenv('device_id')) context.set_context(mode=context.graph_mode, device_target="ascend", device_id=devid)
父主题:
相关文档
意见反馈
文档内容是否对您有帮助?
提交成功!非常感谢您的反馈,我们会继续努力做到更好!
您可在查看反馈及问题处理状态。
系统繁忙,请稍后重试
如您有其它疑问,您也可以通过华为云社区问答频道来与我们联系探讨