Recovery未完成时正常停机为何会阻塞并触发检查点？

在 PostgreSQL 中，当实例因崩溃重启后处于 recovery 状态（即正在回放 WAL 日志、恢复一致性），此时若执行 `pg_ctl stop -m fast` 或 `SIGTERM` 正常停机，进程会**阻塞等待 recovery 完成**，而非立即终止。这是因为：PostgreSQL 要求 shutdown 前必须确保数据状态可持久化且无未决重做操作；若 recovery 未完成，系统尚处于“非一致性但正在趋向一致”的中间态，直接停机会导致下一次启动仍需从更早位置重放 WAL，甚至引发恢复失败或数据不一致风险。因此，主控进程会主动等待 recovery 结束，并在退出前强制触发一次 **checkpoint**——确保所有已恢复的脏页刷盘、更新控制文件中的检查点记录，使 shutdown 后的状态具备完整可恢复性。该行为虽保障了数据安全性，但在长 recovery 场景（如大量 WAL 积压）下易被误判为“卡死”。可通过 `pg_stat_progress_recovery` 视图监控进度，避免误操作。

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

小小浏 2026-02-12 05:40

关注

```html

一、现象层：为什么 `pg_ctl stop -m fast` 在 recovery 中“卡住”？

当 PostgreSQL 因崩溃重启进入 recovery 状态（即 WAL 日志回放阶段），执行 pg_ctl stop -m fast 或向主进程发送 SIGTERM 时，不会立即终止，而是阻塞等待 recovery 完成。这不是 bug，而是设计契约——PostgreSQL 将“shutdown 可恢复性”置于操作响应性之上。该行为在 postmaster 主控进程中硬编码实现：ShutdownSignalHandler() 检测到 RecoveryInProgress() 为真时，自动转入等待循环，直至 RecoveryIsComplete() 返回 true。

二、机制层：阻塞背后的三重保障逻辑

一致性守门人：recovery 是从崩溃点重建事务一致性的唯一路径；中断将导致控制文件中 checkpoint_location 与实际数据页状态错位；
持久化兜底策略：shutdown 前强制触发 CreateCheckPoint(CHECKPOINT_IMMEDIATE | CHECKPOINT_WAIT)，确保所有已 replay 的缓冲区脏页落盘，并更新 pg_control 中的 checkPointCopy.redo；
WAL 连续性锚点：checkpoint 记录定义了下一次启动的最小恢复起点；若跳过，新启动可能从更早 WAL 位置重放，引发 invalid record length 或 could not locate a valid checkpoint record 错误。

三、可观测性：如何确认是否真在“卡死”还是正常等待？

使用以下系统视图实时诊断：

视图	关键字段	用途
`pg_stat_progress_recovery`	`phase`, `total_records`, `records_done`, `percent_done`	显示当前 recovery 阶段（如 `reading WAL`, `applying WAL`）、已处理/总量 WAL 记录数及进度百分比
`pg_stat_replication`	`state`, `recovery_mode`	仅对 standby 有效，但可交叉验证 `recovery_mode = t` 表明处于恢复态

四、实操验证：模拟长 recovery 并观察 shutdown 行为

-- 步骤1：人为制造大量 WAL（例如批量插入 1000 万行并禁用 checkpoint）
SET synchronous_commit = 'off';
INSERT INTO big_table SELECT generate_series(1,10000000);

-- 步骤2：kill -9 postmaster 强制崩溃
-- 步骤3：重启，观察日志中 "database system was interrupted; last known up at ..."
-- 步骤4：另起终端执行：pg_ctl stop -m fast && echo "sent"
-- 步骤5：同时监控：SELECT * FROM pg_stat_progress_recovery;

五、深度解析：源码级行为链路（PostgreSQL 15+）

flowchart LR A[收到 SIGTERM] --> B{RecoveryInProgress?} B -- Yes --> C[进入 WaitForRecoveryToEnd] C --> D[轮询 CheckForRecoveryEnding] D --> E{RecoveryIsComplete?} E -- No --> D E -- Yes --> F[CreateCheckPoint\nCHECKPOINT_IMMEDIATE|WAIT] F --> G[更新 pg_control\n写入最新 redo LSN] G --> H[退出进程]

六、风险警示：绕过等待的“伪解决方案”及其后果

错误做法：用 kill -9 强杀 postmaster —— 导致 pg_control 中 state = IN_CRASH_RECOVERY 残留，下次启动仍需全量 recovery，且可能因 WAL 断链失败；
错误做法：修改 recovery.conf（或 postgresql.auto.conf）删除 standby_mode = on 后 reload —— 触发 promote，但此时数据未完全 replay，产生逻辑不一致；
正确前提：任何干预必须以 pg_stat_progress_recovery.percent_done 持续增长为依据，而非单纯等待时间。

七、高阶调优：缩短 recovery 时间的生产级策略

避免“等待焦虑”的根本在于压缩 recovery 时长：

WAL 归档优化：启用 wal_compression = on 减少磁盘 I/O 压力；
Checkpoint 调优：增大 max_wal_size（如 4GB）+ 降低 checkpoint_timeout（如 15min），使崩溃前 checkpoint 更密集，缩小 recovery 起点偏移；
并行 replay：PostgreSQL 12+ 支持 max_worker_processes 和 max_parallel_workers 提升 WAL 应用并发度（需配合 wal_level = replica）；
硬件协同：将 pg_wal 和数据目录置于不同高速 NVMe 设备，消除 I/O 争用。

八、架构启示：recovery-shutdown 耦合体现的 ACID 工程哲学

PostgreSQL 将 shutdown 视为 recovery 生命周期的自然终点，而非独立操作——这本质是 原子性（Atomicity）与持久性（Durability）在运维接口层的具象化。它拒绝用“可用性妥协”换取“操作便捷性”，要求 DBA 必须理解：数据库不是黑盒服务，而是状态机。每一次 pg_ctl stop 都是对当前物理一致性的最终确认签名。这种设计使 PG 在金融核心账务等场景中获得信任，但也要求团队具备 WAL 生命周期建模能力。

```

报告相同问题？

关注问题

java面试题（六），现在都这么卷了，八股文还适用吗？
2025-04-24 15:39

从头再来的码农的博客现在java面试非常的卷，从jvm、缓存、多线程、分布式、数据库、spring相关、redis、kafka、es等等吧，现在还要求你会AI大模型，微调等等吧有的在这里问ArrayList和数组的，还有人再问AI大模型微调的，如何运用？...
深入 ‘Graceful Degradation’：当内核驱动崩溃时，如何通过微内核（Microkernel）架构实现局部重启？
2025-12-26 16:46

海派程序猿的博客尽管状态恢复依然是最大的挑战，但通过巧妙的设计，如客户端侧重建、检查点或“崩溃即恢复”的设计哲学，我们可以构建出前所未有的高韧性系统。展望未来，随着对系统可靠性和安全性要求的不断提高，微内核及其衍生的...
[Java]Java面试常用知识点总结 — Java web 编程部分（来自牛客资料）
2020-04-26 11:55

一杯糖不加咖啡的博客 [Java]Java面试常用知识点总结 — Java web 编程部分（来自...文章目录[Java]Java面试常用知识点总结 — Java web 编程部分（来自牛客资料）三、Java web 编程1、web 编程基础①Tomcat 服务器1、启动项目时如何实...
2022 Java 核心概念知识点
2022-11-03 10:33

我是王小贱的博客抽象是隐藏实现细节并仅向用户显示功能的过程。另一种方式是，它只向用户显示基本信息并隐藏内部细节。声明为abstract的类称为抽象类。它可以有抽象方法和非抽象方法，它需要扩展并实现其方法，它不能被实例化，它...
中级开发的经验之谈（redis篇）
2024-05-20 22:15

兔老大RabbitMQ的博客在我读书的时候，我曾经很喜欢redis，听了相关的分享、看了相关的博客、读了相关的书、看了喜欢的源码，然后我写了一个总结：《这是全网最硬核redis总结，谁赞成，谁反对？...本文主要是告诉你为什么我们使
面试官问你 Redis 数据如何持久化，你应该这样回答
2021-04-09 00:40

彬禹随笔的博客 https://u.nu/20mh6Redis 提供了多种不同级别的持久化方式：RDB 持久化可以在指定的时间间隔内生成数据集的时间点快照（point-in-time snapshot）。...
Dify工作流异常处理秘籍：暂停与恢复如何拯救线上危机？
2025-11-02 15:55

PixelFlow的博客应对线上工作流异常？Dify 工作流暂停与恢复功能可快速阻断故障传播，支持手动介入调试并安全续跑。适用于数据错误、API异常等场景，保障系统稳定。运维无忧，值得收藏
最新golang语言面试题总结（二）
2022-04-13 21:33

IT_ziliang的博客 GC堆内存上分配的数据对象，不会再使用时，不会自动释放内存，就变成垃圾，在程序的运行过程中，如果不能及时清理，会导致越来越多的内存空间被浪费，导致系统性能下降。因此需要内存回收，内存回收分为两种方式1....
个人后端知识点总结
2024-02-28 14:04

稻香码农.的博客此外，23种设计模式并不是每一种都是很适合我们实际系统开发。如果要用到一个设计模式，要搞懂，我要用它去解决什么问题。比如单例模式，我就希望全局只有一个实例存在；你要使用观察者模式，我就是要将生产和消费...
计算机网络知识点
2024-01-03 19:21

小兔子乖乖-L的博客 1518，头信息有14字节，尾部校验和FCS占了4字节，所以真正留给上层协议传输数据的大小就是：1518 - 14 - 4 = 1500，那么，1518这个值又是从哪里来的呢？MSL（最大分段寿命），即一个 TCP 分段可以存在...通常为4分钟。
全网最硬核 Redis 高频面试题解析（2021年最新版）
2021-04-24 22:53

程序员囧辉的博客 3、Redis 为什么使用单进程、单线程也很快主要有以下几点： 1、基于内存的操作 2、使用了 I/O 多路复用模型，select、epoll 等，基于 reactor 模式开发了自己的网络事件处理器 3、对数据结构进行了优化，简单动态...
Java面试知识点
2023-02-09 15:05

冰红茶不会渴的博客为什么我们调用 start() 方法时会执行 run() 方法，为什么我们不能直接调用 run() 方法 31. 线程的run与start的区别 32. 线程的wait和sleep的区别 33. synchronized 这三种加锁方式（作用对象：静态方法、非静态...
分布式存储ceph知识点整理
2024-08-07 16:08

happy_king_zi的博客如何选择存储底层协议兼容性产品要有定位，功能有所取舍针对特定市场的应用存储被市场认可的存储系统稳定性是第一位的性能第二数据功能要够用软件定义存储 (SDS) 利用基于软件的方法管理数据存储,并提供基于策略的...
面试笔记系列六之redis+kafka+zookeeper基础知识点整理及常见面试题
2024-02-28 17:26

小裕哥略帅的博客目录 Redis redis 为什么那么快 redis持久化机制：RDB和AOF Redis 持久化 RDB的优点 RDB的缺点 AOF 优点 AOF 缺点 4.X版本的整合策略 Redis做分布式锁用什么命令？ Redis做分布式锁死锁有哪些情况，如何解决？ Redis...
Redis持久化机制解析与优化
2025-09-04 15:02

AIHacksCash的博客 RDB持久化在生成快照时会对性能产生较大影响，AOF持久化在追加操作时会对性能产生一定影响。恢复策略 RDB持久化可以通过redis-check-rdb工具来检查RDB文件，AOF持久化可以通过redis-check-aof工具来检查AOF文件。 ...
【面试前最最最先复习一遍的知识点】
2024-08-15 18:52

路有瑶台的博客互斥锁（独占锁）：保证任何时候只有一个线程可以访问共享资源，无论是读/写（严格串行化）read_mode:在此模式下，第一个读者取得读写锁，所有写锁阻塞，而读者可以申请，而最后一个读者释放锁，退出该模式write_...
【信息科学与工程学】数据中心SDN控制器
2025-07-02 15:39

flyair_China的博客该设计严格遵循TOGAF ADM流程，在业务架构上实现网络即服务(NaaS)能力，在技术架构采用云原生控制平面+硬件加速数据平面，并通过分片架构解决大规模组网场景的扩展性问题。A[物理交换机] -- Telemetry Data --> B...
编程术语英汉对照
2008-08-23 18:09

RaRen的博客编译期、编译时　 compiler 编译器编译器　 component 组件组件　 composition 复合、合成、组合组合　 computer 电脑、计算机计算机、电脑　 concept 概念概念 ...
MySQL知识点集合
2021-03-10 19:57

zhangchao.com的博客 only_full_group_by是用来做什么的？作用：字符集&&校对规则字符集校对规则数据类型数字类型字符串类型开发规范建库规范建表规范什么是Online DDL（Algorithm）？copyInplaceInstantpt-osc&&gh-ost...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题今天