Elasticsearch 堆内存和OS Cache 以及搜索、聚合数据的实现原理问题

我有以下想法，不知道是否正确，请各位指教:
1. buffer和尚未写入系统缓存的index segment(就是一段倒排索引)存储在堆内存，其大小受jvm参数控制。
2. 系统缓存 OScache在这里可以被看做是"文件系统缓存"，用于缓存打开后的segment file(段文件)，存储在非堆内存，受操作系统控制。

非堆内存越大，能够打开并缓存的segment file(段文件)就越多，搜索和聚合时，能够直接从内存中获取的热数据也就越多(不需要通过IO，在磁盘中找到尚未打开的segment file，读取文件内容)。

搜索数据时，首先在OS Cache中进行搜索，如果找不到数据，则在磁盘中找到对应的index segment文件并打开，读取数据至堆内存中(ES由java开发，因此一定是读取到堆内存，而不是OS Cache)，接着，在堆内存中对数据进行聚合、排序等操作，最后把数据返回给协调节点，整理后交给调用方。此外，新读取到堆内存的segment file会被Lucense缓存至OS Cache中(如果非堆内存不够用，则新按照写入时间顺序，放弃最早的数据，腾出空间，写入新数据)。

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
蔡能教授，网站特聘专家 2020-04-10 09:39
关注
https://blog.csdn.net/gwd1154978352/article/details/84299940

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

ElasticSearch教程——聚合数据内部原理以及doc value机制内核级原理
2018-11-20 14:40

东天里的冬天的博客 ElasticSearch汇总请查看：ElasticSearch教程——汇总篇聚合数据内部原理聚合分析的内部原理是什么？？？？aggs，term，metric avg max，执行一个聚合操作的时候，内部原理是怎样的呢？用了什么样的数据结构...
Elasticsearch报错「CircuitBreakingException」：JVM堆内存与字段数据缓存的调优
2025-05-08 15:58

喜欢编程就关注我的博客核心调优原则内存优先：确保JVM堆内存不超过物理内存的50%，且不超过32GB。缓存控制：严格限制字段数据缓存大小，优先使用Doc Values。查询优化：避免复杂查询和深度分页，使用分页替代方案。
Elasticsearch - 解决 Elasticsearch 内存占用过高的问题
2025-11-06 20:23

Jinkxs的博客主要内容包括： ES 内存架构解析 JVM 堆内存（≤32GB黄金法则）堆外内存（Page Cache、Direct Buffer）主要内存消耗组件高内存占用的7大原因 Fielddata滥用缓存配置不当高基数聚合批量写入过大 Mapping设计...
Elasticsearch搜索原理
2025-08-22 21:20

代码的余温的博客 Elasticsearch采用分散/聚集模型实现高效分布式搜索：客户端请求到达协调节点后，解析查询并确定目标分片；查询阶段并行分散到各分片执行本地搜索并返回文档ID和评分；协调节点合并结果后，在取回阶段获取完整文档...
Elasticsearch系列---聚合查询原理
2020-04-17 07:59

1黄鹰的博客本篇主要介绍聚合查询的内部原理，正排索引是如何建立的和优化的，fielddata的使用，最后简单介绍了聚合分析时如何选用深度优先和广度优先。正排索引聚合查询的内部原理是什么，Elastichsearch是用什么样的数据...
ElasticSearch搜索引擎：内存分析与设置
2022-02-07 08:00

张维鹏的博客在Elasticsearch 的运行过程中，如何合理分配与设置内存是一件十分重要的事情，否则十分容易出现各种问题。一、Elasticsearch为什么吃内存：我们先看下 ES 服务器的总体内存消耗情况：对于Query Cache、...
Elasticsearch 内存占用排查指南
2025-06-04 18:00

喝醉酒的小白的博客通过以上方法和指标，可全面排查和优化 Elasticsearch 的内存占用情况，提升集群性能和稳定性。根据实际负载情况，调整各类缓存的大小。如字段数据缓存、查询缓存和请求缓存等，避免缓存占用过多内存。为实际主机名...
Elasticsearch 内存里都放了啥？？凭什么本文能解决你 ES 99.9% 的内存问题？
2021-03-26 21:02

dying 搁浅的博客用了这么久 ES 还不清楚他内存里都放了啥？？！！求求你看看这篇文章吧
Elasticsearch-内存结构
2024-02-02 10:05

NCS123456的博客 1）只有Filter下的子Query才能参与Cache。2）不能参与Cache的Query有TermQuery/MatchAllDocsQuery/MatchNoDocsQuery/BooleanQuery/DisjunnctionMaxQuery。3）MultiTermQuery/MultiTermQueryConstantScoreWrapper/...
Elasticsearch (ES)内存管理降低内存占用率
2024-05-29 16:46

洛秋_的博客是 Elasticsearch 中存储文档字段值的一种数据结构，用于支持聚合、排序、脚本和其他操作。在 Elasticsearch 中，文档中的每个字段都可以被索引，并且可以被搜索和分析。当你执行聚合操作、排序、或者使用脚本时，...
没有解决我的问题, 去提问

Elasticsearch 堆内存和OS Cache 以及搜索、聚合数据的实现原理问题

1条回答 默认 最新

1条回答默认最新