关于k8s node节点被释放后如何驱逐节点并添加新节点

关于k8s node节点被释放后如何驱逐节点并添加新节点谁有搭建抢占式k8s服务器的经验。请有相关经验的来回答

如使用驱逐命令也是驱逐不了的
kubectl drain k8s-node2 --ignore-daemonsets

强制驱逐并且删除数据的方法也试过了。
kubectl drain k8s-node2 --ignore-daemonset --delete-emptydir-data --force

一直会运行这样，一个小时后也是一样的输出，就是驱逐不了。

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

14条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
专家-赤兔[在线] 全栈领域优质创作者 2024-04-17 16:03
关注
引自免费微信小程序：皆我百晓生

针对您遇到的问题，即在Kubernetes集群中无法成功驱逐节点k8s-node2，即使使用了kubectl drain命令并附加了--ignore-daemonsets、--delete-emptydir-data和--force选项，且节点状态为NotReady及SchedulingDisabled，您报告的输出表明存在一些阻碍节点成功驱逐的因素。为了解决这个问题，您可以尝试以下步骤：

检查节点状况: 首先，确保k8s-node2节点上没有正在运行的Pod。您已尝试了驱逐命令，但输出显示仍有多个Pod未能被成功驱逐。这可能是由于Pod处于异常状态（例如，Pending、CrashLoopBackOff等）导致的。请使用以下命令查看节点上所有Pod的状态：

kubectl get pods --all-namespaces -o wide | grep "k8s-node2"

如果发现有异常状态的Pod，可能需要手动清理或调整这些Pod。

处理残留Pod: 对于无法正常驱逐的Pod，可能需要采取以下措施：

确认Pod是否有本地磁盘依赖：如果Pod使用了本地存储（如HostPath卷），驱逐时可能会因为数据丢失风险而失败。请检查Pod的YAML定义，确认是否有这类卷。如果有，可能需要手动备份数据或调整Pod配置使用持久化存储。

检查Pod的重启策略：如果Pod的重启策略设置为Always，且容器无法正常启动，它会持续进入Pending状态，阻碍驱逐。可以暂时将这些Pod的重启策略改为OnFailure或Never，待节点驱逐后再恢复。

强制删除Pod：对于无法正常驱逐的Pod，可以尝试强制删除：

kubectl delete pod <pod-name> --grace-period=0 --force --namespace=<namespace>

检查节点锁定情况: 确认节点是否被其他Kubernetes操作（如节点维护、节点升级等）锁定，导致无法驱逐。可以使用以下命令查看节点的锁定状态：

kubectl get node k8s-node2 -o jsonpath='{.metadata.annotations.kubernetes\.io/lock\-holder}'

如果返回非空值，表示节点被锁定。解除锁定后，再尝试驱逐节点。

排查网络问题: 确保节点间的网络通信正常，因为网络问题可能导致节点驱逐命令无法有效执行。检查节点间ping通性、Kubernetes API Server与节点之间的通信等。

检查节点控制器: 确保节点控制器（Node Controller）工作正常，没有因异常导致节点状态更新滞后。可以在Kubernetes控制面板或日志中查看节点控制器状态和日志。

升级或重置Kubernetes组件: 如果上述方法都无法解决问题，可能是Kubernetes集群组件（如API Server、kubelet等）存在bug或配置问题。尝试升级到最新稳定版本，或者重置受影响的组件。

综上所述，通过仔细排查节点状态、残留Pod、节点锁定、网络问题以及节点控制器状态，应该能找到阻碍节点驱逐的原因，并针对性地进行解决。在完成上述步骤后，再次尝试使用驱逐命令：

kubectl drain k8s-node2 --ignore-daemonsets --delete-emptydir-data --force

如果问题依然存在，请提供详细的节点日志、Pod描述信息以及Kubernetes组件日志，以便进一步分析。
解决无用
评论打赏
分享
举报编辑记录

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

k8s 监听节点宕机的时间设置 devops kubernetes 运维
2022-05-07 09:22

回答 2 已采纳我觉得可能不是配置的问题，可能是node节点数目或者node服务器本身资源的问题。一般按照官方的说法，最基本的k8s集群需要三台服务器，1个master 2个node如果你一个node宕机了，另外只剩
k8s NodePort端口连不上 kubernetes 运维运维开发
2022-09-05 17:27

回答 2 已采纳 telnet 10.122.1.24 8080 看看jenkins 起来了吗，或者 curl一下 10.122.1.24:8080
如何在k8s中连接到我的mysql pod或mysql的节点？ kubernetes mysql
2019-05-10 02:27

回答 1 已采纳 Pod listens to port, Service proxies port. Pod listens to port 3306 and Service only proxies port
ansible一键部署k8s1.16集群新增node节点-二进制-参考
2023-06-28 22:12

ansible一键部署k8s1.16集群新增node节点—二进制—参考
k8s部署Redis集群，节点重启pod IP变化，Java代码不能自动连接到新的pod IP，如何自动刷新？ kubernetes redis spring boot
2021-09-27 22:39

回答 2 已采纳 Redis Cluster · lettuce-io/lettuce-core Wiki · GitHub Advanced Java R
在kubernetes节点信息中添加位置，并让kubectl打印出来 kubernetes
2017-08-06 14:06

回答 1 已采纳 Write a program that runs on each node which reads the nodes location and then updates the node's
作为运维人员来说：k8s和docker的区别是什么？ docker kubernetes
2023-03-09 10:22

回答 3 已采纳从云平台运维生产环境看：docker：容器引擎，强调“能做什么”。k8s：容器编排平台，强调“规划怎么做”。一个字： docker必须按照k8s的规划，对容器进行监管。形象点：docker是项目
k8s node节点停机维护，pod如何迁移？
2020-09-01 08:48

木讷大叔爱运维的博客当node节点关机后，k8s集群并没有立刻发生任何自动迁移动作，如果该node节点上的副本数为1，则会出现服务中断的情况。其实事实并非如此，k8s在等待5分钟后，会自动将停机node节点上的pod自动迁移到其他node节点上。 ...
用自己搭建的nginx代理k8s中的NodePort(nodeip+端口)，nginx报302 负载均衡
2020-05-20 18:00

回答 2 已采纳访问有些接口的时候？那就是说nginx的配置已经没问题了啊，nginx的配置就那些，看看其他的报错日志
关于k8s内存的换算问题？ kubernetes linux
2022-02-14 14:48

回答 1 已采纳来，官网地址：https://kubernetes.io/docs/concepts/configuration/manage-resources-containers/我简单说明一下：Mi表示（1M
K8S切换上下文报permission denied kubernetes linux 运维
2022-06-24 06:19

回答 2 已采纳没有权限就赋予权限
k8s添加新的node节点
2020-12-28 11:39

JulyLyakn的博客系统配置： [master server:192.168.200.41] [new node05 server:192.168.200.201] [node1 server:192.168.200.51] [api server:...[4cpu] [20G内存] [50G系统硬盘] [500G数据盘] ...#master节点上在所
ubuntu部署k8s后每次重启都报错，如何解决？ kubernetes ubuntu 容器
2022-09-19 16:27

回答 1 已采纳永久性解决方法：echo "export KUBECONFIG=/etc/kubernetes/admin.conf" > /etc/profile.d/kubeconfig.shsource
往k8s集群中添加node节点
2022-10-11 15:17

运维无止境的博客往k8s集群中添加node节点
k8s之Pod驱逐迁移和Node节点维护
2021-01-14 12:56

最美dee时光的博客本篇是基于k8s-v1.18.0版本，参考https://cloud.tencent.com/developer/article/1552452。一、环境说明主机名 ip 系统版本 docker版本 master 192.168.148.124 CentOS 7.6.1810 19.03.9 node01 192.168....
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已结题（查看结题原因） 4月18日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 4月18日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 4月17日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 4月17日
展开全部

悬赏问题

¥15 随身WiFi网络灯亮但是没有网络，如何解决？
¥15 gdf格式的脑电数据如何处理matlab
¥20 重新写的代码替换了之后运行hbuliderx就这样了
¥100 监控抖音用户作品更新可以微信公众号提醒
¥15 UE5 如何可以不渲染HDRIBackdrop背景
¥70 2048小游戏毕设项目
¥20 mysql架构，按照姓名分表
¥15 MATLAB实现区间[a,b]上的Gauss-Legendre积分
¥15 delphi webbrowser组件网页下拉菜单自动选择问题
¥15 linux驱动，linux应用，多线程

关于k8s node节点被释放后如何驱逐节点并添加新节点

14条回答 默认 最新

问题事件

悬赏问题

14条回答默认最新