lucene怎样在做增量索引的同时更新旧数据？

现在的项目要求做近实时索引，大约15分钟更行一次。数据会不断新增，而旧数据也会经常被修改。我计划用增量索引来做，根据数据库的更新时间来添加文档。但被更新的文档可能索引里已经有了，添加之后数据可能会重复。

请问如何消除这种重复的可能性，是每添加一个document时都先查一下索引里是不是已经有，还是记录数据库所有的修改操作并将id放到队列里，跑索引的时候一起更新？请问lucene有没有更好的内部机制解决这个问题，比如能不能像数据库一样指定unique的字段？

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
xiao_phoenix 2013-05-06 23:13
关注
方案1: 你修改的数据加一个触发器如果你要索引的字段被改动后
把id插入另一张表里然后跑定时任务根据这些ID查找出要索引的数据定时的构建索引然后再把这些IDdelete掉

方案2: 用solr 数据更新量不是太大的话修改了数据可以实时请求solr
查询也可以用solr提供的api 数据更新量太大了还是定时请求solr

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

基于lucene技术的增量索引
2017-05-15 11:39

本文将深入探讨如何利用Lucene实现增量索引，这是一种在数据库或文件系统更新时仅对新数据或变化数据进行索引的技术，以降低资源消耗并保持搜索性能。 **1. Lucene基础知识** Lucene首先需要理解的是它的核心概念，...
Lucene5学习之增量索引(Zoie)
2019-08-10 01:02

在实际应用中，每当有新的person数据插入或更新时，Zoie会监控到这些变化，然后对这些数据进行增量索引，确保索引始终保持最新状态。总结起来，Lucene5学习之增量索引(Zoie)涉及到的关键技术点包括： 1. 基于...
Lucene增量索引的奥秘
2024-08-07 00:55

光子AI的博客如何进一步缩短新文档可被检索的延迟,同时保证系统的稳定性和查询性能,是增量索引技术未来的一大挑战。在Lucene中实现自定义分词器需要继承Tokenizer类，并实现其方法。继承Tokenizer类：创建一个新的类继承...
lucene实时增量索引_Solr搜索引擎 — 通过mysql配置数据源
2020-11-23 02:45

weixin_39861823的博客上一节我们已经通过两种方式运行了solr，本节演示怎么配置solr的mysql数据源附上:喵了个咪的博客：http://w-blog.cnSolr官网：http://lucene.apache.org/solr/PS：8.0.0版本已经发布，本文使用此时较为稳定的7.7.1...
solr增量导入更新索引包
2018-12-05 19:54

增量导入更新索引包是Solr中的一项重要功能，它允许系统仅处理自上次完整索引以来发生改变的数据，从而大大提升了效率并降低了资源消耗。下面将详细阐述Solr增量更新的相关知识点。 1. **Solr的索引机制** Solr...
lucene分词搜索,增量索引及全量索引
2012-03-13 09:44

《Lucene分词搜索、增量索引与全量索引详解》在现代信息检索系统中，搜索引擎扮演着至关重要的角色。Apache Lucene是一个高性能、全文本搜索库，被广泛应用于构建复杂的数据检索应用。本文将深入探讨Lucene的分词...
java增量索引,lucene增量索引的简单实现
2021-04-08 08:05

张小鸡的博客 //取得存储起来的ID，以判定是增量索引还是重新索引booleanisEmpty=true;try{ File file=newFile(storeIdPath);if(!file.exists()) { file.createNewFile(); } FileReader fr=newFileReader(storeIdPath); ...
Lucene添加删除索引（增量索引）
2016-11-08 16:22

小斯123的博客 1。数据库中添加数据增加新纪录： IndexWriter writer = new ...false：在原先基础上添加，不覆盖之前，增量索引 true：重新创建 2。数据库中更新数据判断是否有删除陈旧记录： public void updateIndex
lucene 4.6 为数据库建立增量索引
2014-01-02 14:09

笨菜鸟007的博客 lucene 4.6 为数据库建立增量索引首先去官网下载lucene ，地址：http://www.apache.org/dyn/closer.cgi/lucene/java/4.6.0 下载IK分词源码,地址 : http://code.google.com/p/ik-analyzer/downloads/list ...
【Lucene】Lucene的索引文件格式：深入理解Lucene使用的索引文件格式
2024-11-19 12:52

infiniteWei的博客 Lucene的索引文件格式设计精妙，利用模块化和压缩技术实现了存储空间与查询效率的平衡。segments_N是索引的全局入口，.tis和.tii负责词典管理，....通过这些文件的协作，Lucene能够在大规模数据中实现高效的全文检索。
没有解决我的问题, 去提问

lucene怎样在做增量索引的同时更新旧数据？

1条回答 默认 最新

1条回答默认最新