lite cluster使用流程-九游平台
modelarts lite cluster面向k8s资源型用户,提供托管式k8s集群,并预装主流ai开发插件以及自研的加速插件,以云原生方式直接向用户提供ai native的资源、任务等能力,用户可以直接操作资源池中的节点和k8s集群。本文旨在帮助您了解lite cluster的基本使用流程,帮助您快速上手。

如图所示为lite cluster架构图。lite cluster基于cce服务实现对资源节点的管理,因此,用户首先需要购买一个cce集群。在modelarts控制台购买lite cluster集群时,modelarts的资源池会先纳管这个cce集群,然后根据用户设置的规格创建相应的计算节点(bms/ecs)。随后,cce会对这些节点进行纳管,并且modelarts会在cce集群中安装npudriver、os-node-agent等插件。完成cluster资源池的购买后,您即可对资源进行配置,并将数据上传至存储云服务中。当您需要使用集群资源时,可以使用kubectl工具或k8s api来下发作业。此外,modelarts还提供了扩缩容、驱动升级等功能,方便您对集群资源进行管理。

推荐您根据以下使用流程对lite cluster进行使用。
- 资源开通:您需要开通资源后才可使用lite cluster,在开通资源前,请确保完成所有相关准备工作,包括申请开通所需的规格和进行权限配置。随后,在modelarts控制台上购买lite cluster资源。请参考。
- 资源配置:完成资源购买后,需要对网络、存储、驱动进行相关配置。请参考。
- 资源使用:完成资源配置后,您可以使用集群资源运行训练和推理训练,具体案例可参考。
- 资源管理:lite cluster提供扩缩容、驱动升级等管理手段,您可在modelarts控制台上对资源进行管理。请参考。
名词 |
含义 |
---|---|
容器 |
容器技术起源于linux,是一种内核虚拟化技术,提供轻量级的虚拟化,以便隔离进程和资源。尽管容器技术已经出现很久,却是随着docker的出现而变得广为人知。docker是第一个使容器能在不同机器之间移植的系统。它不仅简化了打包应用的流程,也简化了打包应用的库和依赖,甚至整个操作系统的文件系统能被打包成一个简单的可移植的包,这个包可以被用来在任何其他运行docker的机器上使用。 |
kubernetes |
kubernetes是一个开源的容器编排部署管理平台,用于管理云平台中多个主机上的容器化应用。kubernetes的目标是让部署容器化的应用简单并且高效,kubernetes提供了应用部署、规划、更新、维护的一种机制。使用lite cluster需要用户具备一定的kubernetes知识背景,您可参考。 |
cce |
云容器引擎(cloud container engine,简称cce)是一个企业级的kubernetes集群托管服务,支持容器化应用的全生命周期管理,为您提供高度可扩展的、高性能的云原生应用部署和管理方案。cce九游平台官网文档可参考。 |
bms |
裸金属服务器(bare metal server)是一款兼具虚拟机弹性和物理机性能的计算类服务,为您和您的企业提供专属的云上物理服务器,为核心数据库、关键应用系统、高性能计算、大数据等业务提供卓越的计算性能以及数据安全。 |
ecs |
弹性云服务器(elastic cloud server)是一种可随时自助获取、可弹性伸缩的云服务器,可帮助您打造可靠、安全、灵活、高效的应用环境,确保服务持久稳定运行,提升运维效率。 |
os-node-agent |
modelarts lite k8s cluster节点默认会安装os-node-agent插件,用于对节点进行管理,例如:
|
相关文档
意见反馈
文档内容是否对您有帮助?
如您有其它疑问,您也可以通过华为云社区问答频道来与我们联系探讨