更新时间:2024-06-21 gmt 08:00
工作负载状态异常定位方法-九游平台
工作负载状态异常时,建议先查看pod的事件以便于确定导致异常的初步原因,再针对性解决问题。
定位流程
查看工作负载pod是否处于异常状态步骤如下:
- 登录cce控制台。
- 单击集群名称进入集群,在左侧选择“工作负载”。
- 在页面左上角选择命名空间,找到对应的工作负载,查看其状态。
- 如果工作负载状态为“未就绪”,可通过查看pod的事件等信息确定异常原因,详情请参见pod事件查看方法。
- 如果工作负载状态为“处理中”,一般为过程中的状态,请耐心等待。
- 如果工作负载状态为“运行中”,一般无需处理。如果出现状态正常但无法访问的情况,则需要进一步排查集群内访问是否正常。
您可以在cce控制台界面或者使用kubectl命令查找pod的ip,然后登录到集群内的节点或容器中,使用curl命令等方法手动调用接口,查看结果是否符合预期。
如果容器ip 端口不能访问,建议登录到业务容器内使用“127.0.0.1 端口”进行排查。
pod事件查看方法
方式一
在cce控制台中单击工作负载名称,前往“工作负载详情”页面,找到处于异常状态的实例,单击操作栏中的“事件”进行查看。
图1 查看pod事件
方式二
pod的事件可以使用kubectl describe pod {pod-name}命令查看,
$ kubectl describe pod prepare-58bd7bdf9-fthrp ... events: type reason age from message ---- ------ ---- ---- ------- warning failedscheduling 49s default-scheduler 0/2 nodes are available: 2 insufficient cpu. warning failedscheduling 49s default-scheduler 0/2 nodes are available: 2 insufficient cpu.
事件信息 |
实例状态 |
处理措施 |
---|---|---|
实例调度失败 |
pending |
请参考 |
拉取镜像失败 重新拉取镜像失败 |
failedpullimage imagepullbackoff |
请参考 |
启动容器失败 重新启动容器失败 |
createcontainererror crashloopbackoff |
请参考 |
实例状态为“evicted”,pod不断被驱逐 |
evicted |
请参考 |
实例挂卷失败 |
pending |
请参考 |
实例状态一直为“创建中” |
creating |
请参考 |
实例状态一直为“结束中” |
terminating |
请参考 |
实例状态为“已停止” |
stopped |
请参考 |
相关文档
意见反馈
文档内容是否对您有帮助?
提交成功!非常感谢您的反馈,我们会继续努力做到更好!
您可在查看反馈及问题处理状态。
系统繁忙,请稍后重试
如您有其它疑问,您也可以通过华为云社区问答频道来与我们联系探讨