张腾岳 2025-10-31 05:05 采纳率: 98.6%

已采纳

如何实现K8s中Pod的优雅启停？

在Kubernetes中，如何确保Pod优雅终止时正在处理的请求不被中断？常见问题是容器收到SIGTERM信号后立即停止，导致连接骤断、请求失败。尽管配置了terminationGracePeriodSeconds和preStop钩子，部分应用仍未能完成正在进行的请求处理。如何结合健康检查、关闭前等待及连接 draining 机制，实现真正无损的优雅停机？

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

杨良枝 2025-10-31 08:55

关注

一、Pod优雅终止的基本机制与常见问题

Kubernetes中，当一个Pod被删除时，API Server会将其状态标记为Terminating，并发送SIGTERM信号给容器主进程。默认情况下，容器在收到SIGTERM后有30秒的宽限期（可通过terminationGracePeriodSeconds配置），超时则发送SIGKILL强制终止。

然而，许多应用在接收到SIGTERM后立即停止服务，未等待正在进行的请求完成，导致客户端请求中断或连接重置。即使设置了preStop钩子和延长宽限期，若应用自身不具备优雅关闭能力，仍无法实现真正的无损下线。

常见问题包括：

应用未监听SIGTERM信号，直接退出
HTTP服务器未关闭新连接接入但继续处理旧请求
负载均衡器或Ingress控制器未及时感知Pod失活状态
长连接（如gRPC、WebSocket）未主动通知对端即将关闭

二、从信号处理到应用层优雅关闭

要实现真正无损停机，必须在应用层配合Kubernetes的生命周期管理。以下是以Go语言为例的典型处理模式：

package main

import (
    "context"
    "net/http"
    "os"
    "os/signal"
    "syscall"
    "time"
)

func main() {
    mux := http.NewServeMux()
    mux.HandleFunc("/", func(w http.ResponseWriter, r *http.Request) {
        // 模拟耗时请求
        time.Sleep(10 * time.Second)
        w.Write([]byte("OK"))
    })

    server := &http.Server{Addr: ":8080", Handler: mux}

    go func() {
        if err := server.ListenAndServe(); err != nil && err != http.ErrServerClosed {
            log.Fatalf("Server failed: %v", err)
        }
    }()

    c := make(chan os.Signal, 1)
    signal.Notify(c, syscall.SIGTERM)
    <-c

    ctx, cancel := context.WithTimeout(context.Background(), 30*time.Second)
    defer cancel()

    if err := server.Shutdown(ctx); err != nil {
        server.Close()
    }
}

上述代码通过监听SIGTERM信号触发server.Shutdown()，停止接收新请求，并等待活跃连接完成处理，是实现应用层优雅关闭的关键。

三、结合preStop钩子与健康检查实现连接Draining

Kubernetes提供了preStop生命周期钩子，可在容器终止前执行一段命令或延迟操作。结合服务端点移除与连接draining机制，可有效避免流量进入即将终止的Pod。

机制	作用	配置示例
preStop Hook	在SIGTERM前执行延迟或清理操作	`exec: command: ["sh", "-c", "sleep 10"]`
readinessProbe	控制Pod是否加入Service Endpoints	HTTP检查路径`/healthz`
livenessProbe	决定容器是否存活，影响重启策略	TCP或HTTP探测
terminationGracePeriodSeconds	设置最大优雅终止时间	`60`秒

四、完整无损滚动更新流程设计

通过组合多种机制，构建完整的优雅终止流程。以下是基于Nginx反向代理与gRPC服务的典型场景流程图：

graph TD
    A[Deployment Rolling Update Triggered] --> B[Kubernetes creates new Pod]
    B --> C[New Pod passes readinessProbe]
    C --> D[Add to Service Endpoints]
    D --> E[Old Pod receives SIGTERM]
    E --> F[preStop hook: sleep 5s or call /shutdown]
    F --> G[Set /healthz → failure]
    G --> H[Endpoint controller removes old Pod]
    H --> I[Active requests continue processing]
    I --> J[Within grace period, finish ongoing work]
    J --> K[Container exits cleanly]

该流程确保：新Pod就绪后再终止旧Pod；通过健康检查主动“摘流”；利用preStop延迟等待连接draining；最终在宽限期内完成所有请求。

五、高级场景：长连接与gRPC服务的优雅关闭

对于gRPC等长连接服务，需支持GRACEFUL_SHUTDOWN语义。服务端应：

监听SIGTERM信号
拒绝新的Stream创建
通知客户端即将关闭（可通过GOAWAY帧）
等待现有Stream完成或超时
调用GracefulStop()

Kubernetes侧应配置足够长的terminationGracePeriodSeconds（如60~120秒），并使用preStop配合健康探针快速摘除流量。

六、验证与监控建议

为确保优雅终止机制生效，建议实施以下验证手段：

通过日志确认应用收到SIGTERM并进入关闭流程
监控指标中增加“正在处理请求数”维度
使用Prometheus记录container_terminated_reason
在CI/CD中模拟滚动更新并注入长请求进行测试
利用eBPF工具（如Pixie）跟踪Pod生命周期与连接状态

同时，可定义SLO指标衡量“滚动更新期间错误率”，作为无损发布的客观依据。

本回答被题主选为最佳回答 , 对您是否有帮助呢?

报告相同问题？

关注问题

K8S 滚动更新如何优雅停止 Pod
2020-02-05 08:00

YP小站的博客何谓优雅停止?优雅停止(Graceful shutdown)这个说法来自于操作系统，我们执行关机之后都得 OS 先完成一些清理操作，而与之相对的就是硬中止(Hard shutdown)...
啥叫K8s？啥是k8s？
2018-10-25 16:59

鹿‘s的博客 •Kubernetes介绍 1.背景介绍　云计算飞速发展　- IaaS 　- PaaS 　- SaaS 　Docker技术突飞猛进　- 一次构建，到处运行　- 容器的快速轻量　- 完整的生态环境 ...Kubernetes(k8s)是Googl...
K8S系列-Kubernetes基本概念及Pod、Deployment、Service的使用
2024-07-14 11:36

_微风轻起的博客 K8s的基本介绍、Pod、Deploy、Service的基本使用
【转】啥叫K8s？啥是k8s？
2019-04-18 18:28

msdnchina的博客 kubelet：负责对Pod对于的容器的创建、启停等任务 kube-proxy：实现Kubernetes Service的通信与负载均衡机制的重要组件 Docker Engine（Docker）：Docker引擎，负责本机容器的创建和管理工作　Node节点可以...
Kubernetes 中如何保证优雅地停止 Pod
2020-11-14 20:38

程序员麦冬的博客一直以来我对优雅地停止 Pod 这件事理解得很单纯: 不就利用是 PreStop hook 做优雅退出吗? 但这周听了组里大哥的教诲之后，发现很多场景下 PreStop hook 并不能很好地完成需求，这篇文章就简单分析一下”优雅地停止 ...
k8s中资源对象有哪些及它们如何协作
2024-01-24 18:11

雷湘剑的博客只要在Service定义中设置了ClusterIp:None，就定义了一个HeadLess Service，它与普通的Service关键区别在于它没有ClusterIp地址，如果解析HeadLess Service的DNS域名，则会返回该Service对应的全部Pod的EndPoint...
k8s相关内容
2024-04-08 11:07

不争不忧不愁的博客 Kubelet(关键组件) 负责Pod内容器的创建、启停，并与Master密切协作实现集群管理（注册自己，汇报Node状态） Kubelet是一个工作节点组件。它的任务是跟踪pod及其容器的运行状态。它与pod的YAML或JSON描述文件相关。...
k8s 调度
2020-08-25 17:57

交个朋友之猿田地的博客 k8s 调度1、 k8s 架构k8s的架构如图：我们都知道k8s分为master、node，其中：master 主要有如下几个组件：Kubernetes Controller Manag...
K8s基础
2018-07-16 22:50

阳光七十米的博客 Kubernetes（简称 k8s）是一个开源的，用于管理云平台中多个主机上的容器化的应用，k8s的目标是让部署容器化的应用简单并且高效（powerful）,k8s提供了应用部署，规划，更新，维护的一种机制。 k8s一个核心的特点...
【kubernetes】k8s概念、核心及组件详细说明
2021-07-27 09:34

҉人间无事人的博客文章目录kubernetes说明虚拟化环境框架说明 kubernetes说明 kubernets=k8s原因是因为 k和s中间有8个字母。 kubernetes是用来管理容器的 ...k8s并不直接管理一个个的容器，而是管理的一个个pod pod翻译成中文—
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 11月1日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 10月31日