影评周公子 2026-02-17 16:40 采纳率: 99.1%

已采纳

热点key导致Redis缓存击穿和雪崩，如何有效应对？

**问题：** 当某商品秒杀、热搜榜单或突发新闻等场景下，大量请求集中访问同一个Key（如`hot:item:1001`），若该Key恰好过期或未命中缓存，所有请求将穿透至数据库，造成瞬时高并发压力——即“缓存击穿”；若大量热点Key在同一时间批量失效（如统一设置2小时过期），更会引发“缓存雪崩”。两者均可能导致数据库CPU飙升、响应超时甚至宕机。如何在不显著增加系统复杂度的前提下，实现热点Key的高可用读取与失效平滑，同时兼顾一致性与性能？

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

火星没有北极熊 2026-02-17 16:40

关注

```html

一、现象识别：什么是缓存击穿与缓存雪崩？

缓存击穿指单个热点Key（如hot:item:1001）在过期瞬间遭遇海量并发请求，全部穿透至数据库；缓存雪崩则是大量热点Key因统一TTL（如2小时）在同一秒批量失效，引发数据库洪峰。二者本质都是“缓存层失效→流量直灌DB”，但粒度与影响范围不同。

二、根因剖析：为什么常规缓存策略在此失效？

被动过期机制缺陷：Redis的EXPIRE是惰性删除+定期抽样，无法保证Key准时失效，导致“过期窗口”内请求行为不可控；
无热点感知能力：标准LRU淘汰策略对访问频次不敏感，无法主动保活hot:item:1001类Key；
强一致性幻觉：开发者常误以为“查缓存→查DB→回填缓存”天然线程安全，实则在高并发下存在多线程重复回源、脏写风险。

三、分层防御：从客户端到存储的四层防护体系

层级	技术手段	适用场景	复杂度
客户端	本地缓存（Caffeine）+ 请求合并（Bulkhead）	读多写少、容忍毫秒级陈旧	★☆☆☆☆
代理层	Redis Cluster + 热点Key自动探测+预热	秒杀/热搜榜单实时性要求高	★★★☆☆

四、核心方案：热点Key高可用读取与平滑失效实践

采用“双TTL+逻辑过期+分布式锁降级”组合策略：

逻辑过期（Logical Expiration）：缓存Value中嵌入时间戳字段，应用层判断是否“逻辑过期”，而非依赖Redis物理过期；
互斥重建（Mutex Lock）：仅首个请求获取Redis分布式锁（SET key value EX 30 NX），成功者回源DB并更新缓存，其余等待或返回旧值；
随机TTL偏移：对同一业务类Key（如所有hot:item:*）设置基础TTL+0~300秒随机抖动，避免雪崩；
后台预热守护：通过定时任务扫描访问日志，对QPS>500的Key提前10分钟刷新缓存并延长TTL。

五、代码示例：Java Spring Boot实现逻辑过期+互斥重建

public String getHotItem(String key) {
    String cacheKey = "hot:item:" + key;
    CacheData data = redisTemplate.opsForValue().get(cacheKey);
    if (data == null || data.isLogicallyExpired()) {
        // 尝试获取分布式锁
        String lockKey = "lock:" + cacheKey;
        Boolean isLocked = redisTemplate.opsForValue()
            .setIfAbsent(lockKey, "1", Duration.ofSeconds(10));
        if (Boolean.TRUE.equals(isLocked)) {
            try {
                Item item = dbMapper.selectById(key); // 回源DB
                CacheData newData = new CacheData(item, 7200); // TTL=2h+逻辑时间戳
                redisTemplate.opsForValue().set(cacheKey, newData, Duration.ofSeconds(7210));
                return item.getName();
            } finally {
                redisTemplate.delete(lockKey);
            }
        } else {
            // 锁竞争失败：短暂休眠后重试，或返回兜底缓存
            Thread.sleep(50);
            return getHotItem(key);
        }
    }
    return data.getItem().getName();
}

六、可观测性增强：热点Key全链路追踪

集成OpenTelemetry埋点，对以下指标实时监控：

Key级缓存命中率（区分hot:item:1001与普通Key）
Redis锁获取成功率 & 平均等待时长
逻辑过期触发频次（预警潜在热点衰减）

七、演进路径：从应急修复到智能治理

graph LR A[人工配置热点Key白名单] --> B[基于访问日志的离线热点识别] B --> C[实时Flink流式统计+动态TTL调整] C --> D[AI预测模型：结合舆情/活动日历预判热点]

八、避坑指南：高阶从业者必须警惕的5个反模式

❌ 在锁内执行耗时DB查询且未设超时 → 雪崩连锁反应
❌ 使用Redis SETNX但未校验value一致性 → 锁误释放
❌ 对hot:item:1001类Key启用LFU淘汰 → 主动驱逐热点
❌ 所有Key统一设置固定TTL → 雪崩温床
❌ 忽略缓存与DB双写时序 → 出现短暂不一致

九、性能压测对比数据（单节点Redis 6.2）

策略	QPS峰值	DB穿透率	P99延迟(ms)	缓存命中率
原始方案（无防护）	8400	92%	1280	18%
逻辑过期+互斥重建	21500	3.2%	42	96.7%

十、架构哲学：在一致性、可用性、复杂度之间做务实权衡

对于秒杀等场景，应接受“最终一致性”下的“有限时间窗口内可容忍陈旧”——例如允许hot:item:1001价格在逻辑过期后1秒内未同步，换取系统整体SLA从99.5%提升至99.99%。真正的高可用不在于消灭所有穿透，而在于将穿透控制在DB可承载的基线水位之下，并让故障具备可观察、可收敛、可自愈的工程闭环。

```

本回答被题主选为最佳回答 , 对您是否有帮助呢?

报告相同问题？

关注问题

Redis 缓存击穿（失效）、缓存穿透、缓存雪崩怎么解决？
2022-03-10 08:30

无双.的博客点击上方“CSDN精品课”，选择“置顶公众号”第一时间获取精品编程教程原始数据存储在 DB 中（如 MySQL、Hbase 等），但 DB 的读写性能低、延迟高。比如 MySQL 在 4 ...
Redis缓存三高难题：穿透、击穿、雪崩，一文彻底搞懂！
2025-08-25 18:46

程序员天空的博客本文深入分析了Redis缓存中的三大高危问题：缓存穿透、缓存击穿和缓存雪崩。缓存穿透指查询不存在的数据导致数据库压力骤增，可通过缓存空值、布隆过滤器或参数校验解决；缓存击穿是热点数据过期瞬间被高并发访问，...
解决Redis缓存击穿问题
2025-05-15 09:54

梧秋祈的博客本文主要讲述缓存击穿的概念及解决方法
Springboot使用redis，以及解决redis缓存穿透，击穿，雪崩等问题
2024-09-26 17:34

这孩子叫逆的博客 Bean// 序列化的时候，自动推断类型，将类型信息作为属性写入JSON// 反序列化时候，根据类型的全类名，序列化成对应的对象实例//普通key序列化工具//hash 小key 序列化工具。
Redis三剑客：缓存雪崩、缓存穿透、缓存击穿
2024-11-20 10:46

轻浮j的博客 缓存击穿产生原因：存在高并发的热点键，并且其重建缓存业务复杂，重建缓存耗时长，当热点键过期失效时，大量线程进入重建缓存，查询数据库，导致数据库压力暴涨。缺点：实现复杂，存在误差。1、基于互斥锁的实现。
Redis经典面试题：你知道缓存击穿、缓存穿透、缓存雪崩吗？
2024-03-26 20:03

王二蛋！的博客可能有些初学者对“缓存击穿、缓存穿透、缓存雪崩”这几个名词感到陌生，或者了解过但是一时半会没办法理解。没关系，希望通过本文可以让你轻松理解这些概念并掌握其解决方案，然后在即将到来的金三银四面试中对你...
Redis缓存穿透、击穿、雪崩到底是个啥？7张图告诉你
2022-12-22 09:17

哪吒的博客七、缓存击穿 缓存击穿也叫热点key问题，就是一个被高并发访问并且缓存重建业务较复杂的key失效了，无数的请求访问会在瞬间打到数据库，带来巨大压力。 1、通过互斥锁解决缓存击穿 给缓存重建过程加锁，确保重建...
_基于Redis解决缓存击穿、穿透和雪崩问题的通用解决方案，拿来即用。支持
2024-09-15 01:02

1. 缓存击穿指的是某个热点key在缓存失效的瞬间，大量的并发请求直接访问数据库，导致数据库压力剧增的现象。 2. 缓存穿透是指查询不存在的数据，由于缓存不命中，每次查询都会访问数据库，如果有人利用这个漏洞恶意...
redis缓存雪崩、穿透、击穿的概念及解决思路
2021-06-09 16:57

enjoy编程的博客击穿是redis某一个热点key突然失效，最终的受害者都是数据库。 1. 缓存雪崩 1.1. 概念在高并发下，在数据未加载到缓存中或者缓存同一时间大面积的失效，绝大部分请求都去查数据库，造成数据库短时间内承受⼤量...
Redis缓存穿透、缓存雪崩和缓存击穿
2022-11-19 17:11

编程小菜吉的博客 Redis 缓存的使用，极大的提升了应用程序的性能和效率，特别是数据查询方面。但同时，它也带了一些问题。数据一致性的问题，从严格意义上讲，这个问题无解。...另外一些典型的问题就是，缓存穿透、缓存雪崩、缓存击穿。
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 2月18日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 2月17日