多次失败（>5次）IP常因DNS缓存污染或本地hosts误配导致解析异常

常见问题：某业务系统频繁出现“连接超时”或“无法访问目标服务”，经抓包发现客户端反复尝试向多个不同IP（>5次）发起TCP连接，但均失败；进一步排查发现，这些IP与服务真实地址不符。典型表现为：`nslookup` 与 `dig` 返回结果不一致、`curl -v` 显示解析到异常IP、重启应用后短暂恢复但数小时后复现。根本原因多为——本地DNS缓存遭受污染（如运营商劫持、恶意中间设备伪造响应），或开发/运维人员误在 `/etc/hosts`（Linux/macOS）或 `C:\Windows\System32\drivers\etc\hosts`（Windows）中静态绑定过期/错误IP，且未及时清理。由于系统级DNS缓存（如systemd-resolved、dnsmasq）及应用层缓存（如JVM的`networkaddress.cache.ttl`默认永久）叠加，导致错误解析持续生效，形成“多次失败—重试—再失败”的恶性循环。

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

远方之巅 2026-02-15 05:35

关注

```html

一、现象层：识别“连接超时”背后的异常DNS行为

业务系统日志持续报错 Connection timed out 或 Failed to connect to [host]: No route to host；Wireshark/tcpdump 抓包显示客户端在 3–5秒间隔内向6+个不同IP（如 192.0.2.101、203.0.113.44…）发起SYN，全部无SYN-ACK响应；curl -v https://api.example.com 显示解析到非生产网段IP（如 100.64.0.10），而 dig api.example.com @8.8.8.8 +short 正确返回 203.208.60.123。此为典型“解析漂移”现象——同一域名在毫秒级内被解析为多个错误地址。

二、验证层：交叉比对DNS解析链路的五级缓存

应用层：JVM 缓存（networkaddress.cache.ttl=0 可禁用，但默认为 -1 即永久）
运行时层：glibc getaddrinfo() 的 __res_maybe_init 缓存（Linux 5.10+ 默认启用，TTL≈30s）
系统服务层：systemd-resolved（resolvectl statistics 查缓存命中率）、dnsmasq（sudo dnsmasq --test && sudo systemctl status dnsmasq）
OS配置层：/etc/hosts 静态绑定（grep -i "example.com" /etc/hosts）、/etc/resolv.conf nameserver 顺序
网络中间层：运营商DNS劫持（对比 dig @114.114.114.114 vs @223.5.5.5 vs @8.8.8.8 结果差异）

三、根因层：DNS污染与缓存叠加的恶性循环模型

graph LR A[客户端发起HTTP请求] --> B{JVM DNS缓存查询} B -->|命中错误IP| C[直接连接失败] B -->|未命中| D[glibc getaddrinfo调用] D --> E{systemd-resolved缓存?} E -->|是| F[返回污染IP] E -->|否| G[转发至上游DNS] G --> H[遭遇ISP劫持/中间人伪造响应] H --> I[写入systemd-resolved缓存] I --> J[后续JVM/glibc均复用该错误记录] J --> C

四、诊断层：标准化排查清单（含命令速查表）

层级	检测命令	关键指标
应用层	`java -XshowSettings:properties -version 2>&1 \| grep networkaddress`	确认 `networkaddress.cache.ttl` 和 `networkaddress.cache.negative.ttl`
系统服务	`resolvectl query api.example.com && resolvectl statistics`	查看 `Cache hits` 与 `Cache misses` 比值是否异常高
静态配置	`getent hosts api.example.com`（绕过DNS，直查hosts+DNS）	若返回结果与 `dig` 不一致，即证明 /etc/hosts 干扰

五、解决层：分阶段清除策略与长效防护

立即止血：执行 sudo systemd-resolve --flush-caches（systemd）或 sudo systemctl restart dnsmasq（dnsmasq）；Windows 运行 ipconfig /flushdns
应用隔离：JVM 启动参数强制刷新策略：-Dnetworkaddress.cache.ttl=30 -Dnetworkaddress.cache.negative.ttl=5
基础设施加固：将 resolv.conf 指向可信DNS（如 nameserver 1.1.1.1），并启用 DNSSEC（resolvectl dnssec example.com 返回 supported）
自动化监控：部署 Prometheus + Blackbox Exporter，对关键域名做 dns_probe_success == 0 告警，并关联 dns_probe_dns_server 标签定位污染源

六、预防层：面向SRE的DNS治理规范

建立《DNS变更双签制》：任何 /etc/hosts 修改需经开发+运维双人审批并提交Git审计；在CI/CD流水线中嵌入 dnscheck 工具（如 dnscheck），对部署前镜像执行 host -t A api.example.com 断言；Kubernetes集群统一使用 CoreDNS 配置 forward . 1.1.1.1 8.8.8.8 并开启 log 插件记录异常响应码（如 REFUSED、SERVFAIL）。

```

本回答被题主选为最佳回答 , 对您是否有帮助呢?

报告相同问题？

关注问题

一次 Node.js 服务线上问题引出的 DNS 缓存方案研究与思考
2021-05-29 00:18

傲娇的koala的博客，Node.js每次域名请求时都会请求DNS Server 使用DNS缓存注意缓存的过期时间实现DNS缓存的相关依赖 lookup-dns-cache lookup-dns-cache是很成熟的DNS缓存库，但比较古老 image.png 他的思路比较简单：底层查询使用...
一文看懂：网址，URL，域名，IP地址，DNS，域名解析
2022-03-31 21:55

AI研习社的博客专注于前端、Java/Python/Go/PHP的技术社区来源：猴哥技术站今天给大家梳理一篇关于网址、URL、IP地址、域名、DNS、域名解析的白话长文，并以简单的提问-解答形式让读者更加深刻理解网址、URL、IP地址、域名、DNS、...
DNS 缓存、CDN 缓存、浏览器缓存，JVM DNS 缓存详解
2021-04-16 14:30

zzhongcy的博客最近测试遇到修改host文件后，清除浏览器缓存后，重启浏览器后，发现浏览器还是访问老DNS服务，于是网上查查原因，豁然开朗。这里对互联网上一些文章进行整理，原文可查看参。 1、DNS 缓存 1.1 什么是DNS ...
DNS解析 HTTP TCP/IP ICMP/NAT/NAPT相关知识点
2026-03-15 13:12

铭哥的编程日记的博客本文讲解DNS解析，HTTP，TCP/IP ，ICMP/NAT等相关知识点
DNS反向解析：从原理到实战指南
2025-08-07 16:03

Sally璐璐的博客 DNS反向解析（Reverse DNS Lookup）是将IP地址转换为域名的过程，通过查询PTR记录实现，与正向解析形成互补。主要应用于邮件服务器验证（如SPF检查）、日志分析（IP转可读域名）、网络安全审计（异常流量识别）和...
【R语言】完美解决devtools安装GitHub包失败的问题（以gwasglue为例）
2023-09-21 02:52

感谢地心引力的博客但是我的电脑不可能出现这种问题但是，读者需要先解决网络问题，首先确保你的电脑能流畅访问GitHub，最简单的方法就是修改hosts文件（本地dns缓存，就是把github的域名解析陈ip地址，github有很多ip地址（CDN），有...
闲谈寻址-DNS的多级缓存系统
2017-11-18 15:10

dog250的博客提到DNS，基本上没有不知道的，这个DNS协议非常非常之复杂，令人望而却步。我敢说DNS的复杂程度堪比HTTP，但是为什么却没有HTTP受关注度更高？世界从来不以复杂分高下，DNS虽然使用范围胜过HTTP，然而却不如HTTP浮于...
Linux服务器编程实践8-用tcpdump观察DNS通信过程，理解域名解析原理
2025-10-10 14:36

迎風吹頭髮的博客本文通过tcpdump工具实际抓包分析DNS域名解析...文章还分析了DNS缓存机制和常见故障原因，并总结了从DNS查询到IP获取的完整流程。这种实践方法生动展示了域名解析的底层实现，对Linux网络编程和故障排查具有实用价值。
黑客技术？没你想象的那么难！——dns劫持篇（dns劫持_DNS劫持_dns劫持怎么处理_dns劫持是什么意思_dns劫持是怎么回事,怎么处理_dns劫持异常怎么修复_是否遭到dns劫持_dns劫持）
2026-02-26 18:10

程序员七海的博客 dns劫持_DNS劫持_dns劫持怎么处理_dns劫持是什么意思_dns劫持是怎么回事,怎么处理_dns劫持异常怎么修复_是否遭到dns劫持_dns劫持
UDP编程-DNS解析器的分析与实现（C语言）
2021-12-18 15:24

abcd552191868的博客将域名和IP地址相互映射的一个分布式数据库，DNS使用的端口是53。对于每一级域名长度的限制是 63 个字符，域名总长度则不能超过 253 个字符。域名系统（英文：Domain Name System，缩写：DNS）的作用是将人类可读...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 2月16日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 2月15日