kubelet.service: Failed with result 'exit-code'.

安装Kubernetes 1.28报错：The kubelet is not running 报错如下


Unfortunately, an error has occurred:
    timed out waiting for the condition

This error is likely caused by:
    - The kubelet is not running
    - The kubelet is unhealthy due to a misconfiguration of the node in some way (required cgroups disabled)

If you are on a systemd-powered system, you can try to troubleshoot the error with the following commands:
    - 'systemctl status kubelet'
    - 'journalctl -xeu kubelet'

报错日志如下

11月 28 14:12:22 godlnode kubelet[3307]: E1128 14:12:22.488533    3307 pod_workers.go:1300] "Error syncing pod, skipping" err="failed to \"CreatePodSandbox\" for \"kube-controller-manager-godlnode_kube-system(43951358d04c1af6299c0c9422c22850)\" with CreatePodSandboxError: \"Failed to create sandbox for pod \\\"kube-controller-manager-godlnode_kube-system(43951358d04c1af629

以参考方案无法实现
https://www.jianshu.com/p/4b20e7ea4883

辛苦解答

当前的kubelet服务是正常的

systemctl status kubelet 
● kubelet.service - kubelet: The Kubernetes Node Agent
     Loaded: loaded (/lib/systemd/system/kubelet.service; enabled; vendor preset: enabled)
    Drop-In: /etc/systemd/system/kubelet.service.d
             └─10-kubeadm.conf
     Active: active (running) since Thu 2024-11-28 19:47:56 CST; 17min ago
       Docs: https://kubernetes.io/docs/
   Main PID: 952 (kubelet)
      Tasks: 11 (limit: 2218)
     Memory: 101.6M
        CPU: 8.586s

kubelet的报错如下

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

37条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
M_try的小尾巴 2024-11-28 20:09
关注
获得0.25元问题酬金
提示： 本回答参考 AIGC，由本人审核整理提供。若问题解决，望采纳；如仍有疑问，请评论回复。

问题分析

根据你提供的信息，Kubernetes 1.28 安装过程中 kubelet 服务未能正常启动，导致整个集群无法正常运行。具体错误信息包括：

kubelet 未运行：这是导致问题的主要原因。
kubelet 健康状态异常：可能是由于节点配置错误，特别是所需的 cgroups 未启用。
Pod 创建失败：具体表现为 CreatePodSandbox 失败，这通常与 kubelet 的运行状态有关。

解决方案

1. 检查 kubelet 服务状态

首先，使用以下命令检查 kubelet 服务的状态：

systemctl status kubelet

如果 kubelet 服务未启动，尝试启动它：

systemctl start kubelet

如果启动失败，查看详细的日志信息：

journalctl -xeu kubelet

2. 检查 cgroups 配置

kubelet 需要 cgroups 来管理容器的资源。确保你的系统启用了所需的 cgroups。你可以通过以下步骤检查和配置 cgroups：

检查 cgroups 是否启用：

cat /proc/cgroups

确保 memory 和 cpu 等关键 cgroups 是启用的。

配置 kubelet 使用 cgroups：

编辑 kubelet 的配置文件（通常位于 /etc/systemd/system/kubelet.service.d/10-kubeadm.conf），确保以下参数正确配置：

[Service] ExecStart= ExecStart=/usr/bin/kubelet --cgroup-driver=systemd --runtime-cgroups=/systemd/system.slice --kubelet-cgroups=/systemd/system.slice

然后重新加载 systemd 配置并重启 kubelet：

systemctl daemon-reload systemctl restart kubelet

3. 检查 Pod 创建失败的具体原因

根据你提供的日志信息，CreatePodSandbox 失败，这通常与 CNI（容器网络接口）配置有关。检查你的 CNI 配置是否正确：

检查 CNI 插件：

确保你的 CNI 插件（如 Flannel、Calico 等）已正确安装并配置。

检查网络配置：

确保网络配置文件（如 /etc/cni/net.d/ 目录下的文件）正确无误。

检查 kubelet 的 CNI 配置：

确保 kubelet 的 --network-plugin 参数正确指向你的 CNI 插件。

4. 参考其他解决方案

你提到参考了简书上的解决方案，但未能解决问题。建议你详细检查该解决方案中的每一步，确保没有遗漏任何配置。

总结

检查 kubelet 服务状态：确保 kubelet 服务已启动并运行正常。
检查 cgroups 配置：确保系统启用了所需的 cgroups，并正确配置 kubelet 使用 cgroups。
检查 Pod 创建失败的原因：特别是 CNI 配置，确保网络插件和配置文件正确无误。

通过以上步骤，你应该能够解决 kubelet 未运行的问题，并使 Kubernetes 集群恢复正常。
解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

kubelet.service: Failed with result 'exit-code'.
2023-03-25 17:53

牛奔的博客检查kubelet服务状态 systemctl status kubelet 检查journal日志 journalctl的-u参数可以指定服务进行过滤，这样可以屏蔽掉其他无关日志。--no-pager参数可以一次性输出日志 ...
部署大模型:解决ollama.service: Failed with result ‘exit-code‘的问题
2025-05-13 20:28

Alaso_shuang的博客通过systemctl status ollama命令，发现服务处于activating (auto-restart)状态，且ExecStart进程以exit-code状态失败。进一步使用journalctl -u ollama -f查看日志，发现是文件访问权限问题导致服务启动失败。用户...
httpd.service: Failed with result ‘exit-code‘.；Failed to start The Apache HTTP Server
2024-05-24 09:48

来自于狂人的博客解决这个问题的方法之一是确保端口80可供Apache使用。你提到的使用firewall-cmd添加端口80到防火墙规则是正确的步骤，但在执行该命令之前，请确保端口80确实没有被其他程序占用。如果发现端口80已经被占用，你可以...
docker.service: Failed with result ‘exit-code‘
2021-07-07 11:49

正怒月神的博客 docker.service: Failed with result 'exit-code' 查看日志： $ sudo dockerd --debug 看到是我们的daemon.json文件有问题打开daemon.json sudo vim /etc/docker/daemon.json 改为 { "registry-...
树莓派 ubuntu系统： mysql.service: Failed with result ‘exit-code‘
2022-04-18 13:49

呜妍胀气的博客最近在做火灾报警系统的时候，mysql服务老是会出现 mysql.service: Failed with result ‘exit-code’ 这个错误，导致数据库运行不起来。我的解决办法是：先kill mysqld有关的进程，再启动mysql服务，mysql就起来了...
kubelet启动报错：kubelet.service: Failed with result 'exit
2019-02-24 18:09

那记忆微凉的博客 qyh@qyh-master:/home/kubernetes$ systemctl status kubelet ● kubelet.service - Kubernetes Kubelet Loaded: loaded (/lib/systemd/system/kubelet.service; enabled; vendor preset: Active: failed (Re...
tomcat.service: Failed with result ‘exit-code‘. tomcat 部署启动失败 Failed with result ‘exit-code‘ 原因之一
2022-06-15 14:56

仅借清风几许几的博客 tomcat.service: Failed with result 'exit-code'. tomcat 部署启动失败 Failed with result 'exit-code' 原因之一
【mysql 127错误】mysql启动报错mysqld.service: Failed with result ‘exit-code‘.
2024-03-22 20:23

东华果汁哥的博客未能启动，并且给出了退出码（exit-code）为127。服务启动时无法找到必要的执行文件或库文件。无网环境，mysql 安装出现如下错误。找到了，原来是缺少两个文件。
【mysql 127错误】mysql启动报错mysqld.service Failed with result ‘exit-code‘
2024-12-07 22:53

m0_74824823的博客 Mar 22 20:20:44 mysql systemd[1]: mysqld.service: Failed with result 'exit-code'. Mar 22 20:20:44 mysql systemd[1]: Failed to start MySQL Server. 这是什么mysql 错误，如何解决，启动不了错误信息显示...
解决 nvidia-fabricmanager.service has entered the ‘failed‘ state with result ‘exit-code‘.
2025-05-12 14:20

gs80140的博客 root@node1:/data1/tmp# journalctl -xeu nvidia-fabricmanager.service ░░ The unit nvidia-fabricmanager.service has entered the 'failed' state with result 'exit-code'. May 12 14:11:08 node1 nvidia-...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 12月6日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 11月28日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 11月28日

kubelet.service: Failed with result 'exit-code'.

37条回答 默认 最新

问题分析

解决方案

1. 检查 kubelet 服务状态

2. 检查 cgroups 配置

3. 检查 Pod 创建失败的具体原因

4. 参考其他解决方案

总结

问题事件

37条回答默认最新