九游平台/ ai开发平台modelarts/ 常见问题/ lite server/ 哪里可以了解atlas800训练服务器硬件相关内容
更新时间:2025-01-22 gmt 08:00

哪里可以了解atlas800训练服务器硬件相关内容-九游平台

场景描述

本文提供atlas800训练服务器硬件相关指南,包括三维视图、备件信息、hccl常用方法以及网卡配置信息。

atlas 800训练服务器三维视图

atlas 800 训练服务器(型号9000)是基于华为鲲鹏920 snt9处理器的ai训练服务器,实现完全自主可控,广泛应用于深度学习模型开发和ai训练服务场景,可单击查看硬件三维视图。

atlas 800训练服务器hccn tool

主要介绍集群网络工具hccn_tool对外接口说明,包括配置roce网卡的ip、网关,配置网络检测对象ip和查询lldp信息等。

atlas 800训练服务器备件查询助手

可以帮助您查询服务器的所有部件、规格描述,数量等详细信息。

打开网站后请输入sn编码“2102313lnr10p5100077”, 若失效可以提工单至华为云modelarts查询。

atlas 800训练服务器的网卡配置问题

  1. 机头网卡配置是什么?
    有以下两类网卡:
    • 四个2*100ge网卡,为roce网卡,插在npu板。
    • 一个4*25ge/10ge,为hi1822网卡,插在主板上的。
  2. ifconfig能看到的网卡信息吗

    能看到主板上的网卡信息,即vpc分配的私有ip。如果要看roce网卡的命令需要执行“hccn_tools”命令查看,参考中的指导。

  3. npu上的网卡在哪里可以看到, 会健康检查吗?

    8*npu的网卡为机头上配置的四个2*100ge网卡。华为云有网卡健康状态监控机制。

相关文档

网站地图