k8s集群重启后，kubelet一直报systemctl restart kubelet.service "Failed to delete cgroup paths"

重启k8s集群后报systemctl restart kubelet.service
"Failed to delete cgroup paths" cgroupName=[kubepod...iled to rem
Apr 13 22:21:10 saas-billing-gth-099-135 kubelet[11206]: 8c4eca96_0268_4e82_81be_db897fde2924.slice]"

手工去删除也不行
sudo rmdir kubepods-burstable-pod3aacc9e5_6dfa_47d3_8156_f0d820efb52d.slice
rmdir: failed to remove ‘kubepods-burstable-pod3aacc9e5_6dfa_47d3_8156_f0d820efb52d.slice’: Device or resource busy

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

22条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
专家-赤兔[在线] 优质创作者: 编程框架技术领域 2024-04-13 23:00
关注
获得0.45元问题酬金
引自免费微信小程序：皆我百晓生

针对您在Kubernetes（k8s）集群重启后遇到的kubelet服务启动失败，并提示“Failed to delete cgroup paths”的问题，这里提供详细的排查与解决步骤：

一、理解错误信息

错误信息表明kubelet在尝试删除与cgroup相关的路径时遇到了问题。cgroups是Linux内核中的一个特性，用于对进程进行资源限制、优先级分配以及统计等操作。在Kubernetes中，kubelet通过cgroups管理Pod及容器的资源配额。当kubelet尝试清理旧的或无效的cgroup路径时遇到阻碍，就会出现此类错误。

二、排查步骤

检查系统日志：完整查看kubelet服务的日志（通常位于/var/log/messages、/var/log/kubelet.log或journalctl -u kubelet），以获取更多关于此错误的上下文信息和可能的关联错误。

确认cgroup配置：确认您的系统是否正确配置了cgroup驱动。在kubelet配置文件（通常为/etc/kubernetes/kubelet.conf）中查找--cgroup-driver参数，确保其值与Docker使用的cgroup驱动一致。Docker的cgroup驱动可通过运行docker info | grep -i cgroup命令来查看。

检查cgroup路径：根据错误信息中的cgroupName（例如：8c4eca96_0268_4e82_81be_db897fde2924.slice），在系统中定位相关cgroup路径（通常位于/sys/fs/cgroup/目录下）。检查这些路径是否存在，以及其权限设置是否允许kubelet删除。

检查残留的Pods或容器：使用kubectl get pods --all-namespaces命令检查是否有未被清理的Pods。如果有，尝试手动删除它们（kubectl delete pod <pod-name> --namespace=<namespace>）。同时，使用docker ps -a检查是否有残留的Docker容器，如有，也应手动清理。

检查磁盘空间：如果磁盘空间不足，可能导致kubelet无法正确清理cgroups。使用df -h检查系统磁盘使用情况，确保有足够的空间。

三、解决措施

根据上述排查结果，可尝试以下解决方法：

修复cgroup配置：如果发现kubelet与Docker的cgroup驱动不匹配，需修改kubelet配置文件中的--cgroup-driver参数，使其与Docker一致，然后重启kubelet服务。

手动清理cgroup路径：如果确认无用的cgroup路径确实存在且无法自动删除，可以尝试以root用户手动删除。但请注意，这一步需谨慎操作，确保所删路径确实无用且不会影响其他系统组件。

清理残留资源：如发现有未被清理的Pods或Docker容器，按照上述排查步骤中的命令进行清理。

释放磁盘空间：若磁盘空间不足，清理不必要的文件或扩展磁盘空间，确保kubelet能够正常工作。

重启kubelet服务：在执行上述操作后，重新启动kubelet服务：systemctl restart kubelet.service。观察服务是否能成功启动，以及日志中是否仍有相关错误。

四、预防措施

为避免类似问题再次发生，可以考虑以下预防措施：

定期清理残留资源：可以编写定时任务定期清理未完成终止的Pods和Docker容器，保持系统整洁。

监控磁盘空间：设置系统监控，及时预警磁盘空间不足的情况，防止因空间耗尽导致的问题。

保持系统与组件更新：定期更新操作系统和Kubernetes相关组件，以获取最新的bug修复和稳定性改进。

通过以上步骤，应该能有效地解决kubelet因“Failed to delete cgroup paths”导致的服务启动失败问题。如果您在执行过程中遇到具体困难或有其他疑问，欢迎继续提问。
解决无用
评论打赏
分享
举报编辑记录

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

Ubuntu20.04虚拟机使用Kubeadm从0到1搭建K8S集群(超详细)
2022-02-28 08:48

imba_wolf的博客 k8s-master: 10.211.55.122 k8s-node-1:10.211.55.123 k8s-node-2:10.211.55.124 k8s-node-3:10.211.55.125 统一修改root密码，后续操作如无特别说明，均在root用户中执行： sudo passwd root 查看网卡名称： ip a ...
基于k8s的综合的web服务器构建
2024-03-14 21:17

澈明123的博客 1.更加深入的了解了k8s的各个功能（service，pv，pvc，ingress）等。1.配置静态ip地址和设置主机名和关闭selinux和firewalld。k8s设计的时候为了能提升性能，默认是不允许使用交换分区的。模拟企业里的k8s生产环境,,...
云原生|kubernetes部署和运行维护中的错误汇总（不定时更新）
2022-08-29 13:14

晚风_END的博客查询kubelet服务状态，是失败的，查看系统日志/var/log/messages可以看到如下内容： F0827 15:18:26.995457 29538 server.go:274] failed to run Kubelet: misconfiguration: kubelet cgroup driver: "cgroupfs" is...
【谷粒商城】k8s、devops集群篇(4/4)
2020-07-27 15:28

hancoder的博客 1、K8s快速入门 1）简介 kubernetes简称k8s。是用于自动部署，扩展和管理容器化应用程序的开源系统。中文官网：https://kubernetes.io/Zh/ 中文社区：https://www.kubernetes.org.cn/ 官方文档：...
1.k8s基本使用（测试加分）
2023-03-21 19:22

白狼_QAQ的博客 Pod是一组紧密关联的容器集合，支持多个容器在一个Pod中共享网络和文件系统，可以通过进程间通信和文件共享这种简单高效的方式完成...很多人认为，k8s只是运维需要掌握的技术，讲真，测试和运维、开发都有技术交集。
二进制安装Kubernetes（k8s） v1.24.0 IPv4
2022-06-29 15:31

Jerry00713的博客感谢：二进制安装Kubernetes（k8s） v1.24.0 IPv4/IPv6双栈 - ...建议k8s集群与etcd集群分开安装宿主机要求：宿主机要求：必须是Centos8以上，因为 k8s v1.24.0 在CentOS 7有兼容性问题，会导致有些字段不识别kubelet
二进制安装K8S集群
2020-03-31 23:11

OneLpc的博客实验环境说明实验架构图实验主机说明 ...k8s运维节点 2c2g zzgw7-11.host.com 10.4.7.11 k8s代理节点 2c2g zzgw7-12.host.com 10.4.7.12 k8s代理节点 2c2g zzgw7-21.host.com 10.4....
容器入门（K8s）
2023-09-01 02:22

想做运维大佬的博客维护运行的pod并提供Kubernetes运行时的环境 Kube-proxy Kube-proxy用于管理service的访问入口，包括集群内pod到service的访问和集群外访问service Kubelet Kubelet是在集群内每个节点中运行的一个代理，用于保证pod...
k8s 学习笔记
2021-10-13 15:13

足球_文史_美酒的博客 # yum install --setopt=obsoletes=0 kubeadm-1.17.4-0 kubelet-1.17.4-0 kubectl-1.17.4-0 -y # 4、配置kubelet的cgroup #编辑/etc/sysconfig/kubelet, 添加下面的配置 KUBELET_CGROUP_ARGS="--cgroup-driver=...
基于SNAT+DNAT发布内网K8S及Jenkins+gitlab+Harbor模拟CI/CD的综合项目
2023-09-05 15:11

宛如清风03的博客基于SNAT+DNAT发布内网K8S及Jenkins+gitlab+Harbor模拟CI/CD的综合项目centos 7.9(11台，3台k8s集群2核2G，1台gitlab4核8G，7台1核1G)，docker 24.0.5，nginx1.21.1，prometheus ，grafana ，gitlab ，Jenkins ，...
k3s安装过程
2022-07-14 15:47

月夜楓的博客 k3s安装
谷粒商城 - 个人笔记(集群部署篇一)
2024-05-30 16:51

知行-wts的博客本内容仅用于个人学习笔记，如有侵扰，联系删一、k8s 集群部署 1、k8s 快速入门 1.1、简介 Kubernetes 简称 k8s。是用于自动部署，扩展和管理容器化应用程序的开源系统。中文官网：https://kubernetes.io/zh/ ...
二进制部署k8s day02
2020-01-01 09:37

雷神_zero的博客 flanned 部署两个运算节点都需要安装 ...mkdir /opt/flannel-v0.11.0 tar xf flannel-v0.11.0-linux-amd64.tar.gz -C /opt/flannel-v0.11.0/ ln -s...
【云原生】Kubernetes学习笔记
2023-09-23 14:07

pass night的博客 Kubernates学习笔记; 在真实集群中学习Kubernate的使用, 包含了Kubernetes的基本使用及部署
云平台服务
2025-08-18 15:33

m0_73676272的博客时间服务 - nova 服务器之间的时间必须保持一致 - 编辑配置文件 /etc/chrony.conf - server 192.168.1.254 iburst - 重启服务 - systemctl restart chronyd - 测试服务 chronyc sources -v //出现*号代表NTP时间可用...
Kubernetes 入门笔记
2024-10-25 15:58

兰若寺外听风雨的博客 Kubernetes，首字母 K，尾字母 s，中间 8 个字母，简称 K8s。kubectl 是 Kubernetes 集群的命令行工具，通过 kubectl 能够对集群本身进行管理，并能够在集群上进行容器化应用的安装和部署。YAML 文件 : 就是资源清单...
kubernetes 教程笔记
2023-03-07 09:13

Z7·的博客下载kubectl安装验证与类似，minikube 是一个工具，能让你在本地运行 Kubernetes。在你的个人计算机（包括 Windows、macOS 和 Linux PC）上...在k8s中部署一个nginx服务，测试下集群是否正常工作复制代码隐藏代码
kubernetes完整学习笔记
2022-06-02 11:11

我非鱼_你非我的博客 k8s完整学习笔记
跟我一步步二进制部署高可用kubernetes集群（上）
2021-12-23 23:20

运维开发故事的博客微信公众号：运维开发故事，作者：double冬 1.实现架构 image 1.1 硬件环境创建5台虚拟机网络：可通外网 Role HOSTNAME IP CPU MEM OS DISK LB、DNS zdd211-11.host.com 10.211.55.11 2C 2G Centos7.5 ...
DEVOPS架构师 -- 02Kubernetes落地实践之旅
2021-10-23 22:03

FikL919的博客文章目录第二天 Kubernetes落地实践之旅纯容器模式的问题容器调度管理平台架构图核心组件工作流程架构设计的几点思考实践--集群安装k8s集群主流安装方式对比分析核心组件理解集群资源kubectl的使用实践--使用k8s管理...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 4月21日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 4月13日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 4月13日

k8s集群重启后，kubelet一直报systemctl restart kubelet.service "Failed to delete cgroup paths"

22条回答 默认 最新

问题事件

22条回答默认最新