这样的需求是使用【lucene】还是使用【数据库索引】

我有这样的一个需求：

一个数据库表格：（有很多个主要字段,其中内容固定，每个字段的长度都很短，记录数10W+ 可能更多）

1.省份 | 2. 市 | 3. 街 | 4. 经度 | 5. 纬度 | ………………

目标：1）可以实现：（省市街）三个条件的单独或者组合模糊查找如找纬度：120~~130 以内经度 80~~100以内的记录：如：单查： “某某街” （符合要求的全部列出）

                                                                                                          组合： "某"  （市）    "某"  (街)  或者  "某" (省)  "某"  (街)     （ 符合要求的全部列出）


    2）经度和纬度是类似于  (123.48,46.54 )的双精度类型的数据

        可以实现：通过给出一组 经纬度值，查出在其范围内的符合要求的记录 :



    3）很短时间完成

以上需求都要把满足条件的所有的字段取出来，有可能以后要扩展！

您的回答1：需要这样的一些要求，是用Lucene好？还是数据库索引好？哪个速度快？

您的回答2：我们BOOS叫我用数据库索引，但是我不是DBA。才毕业，我用lucene做了个测试500W+的数据查找需要400毫秒左右！这样的速度是不是太慢了？【2.5G的CPU，1G内存，XP】

您的回答3：我们BOOS昨天给我说，他的目标是：（10W+的模糊查找）【1毫秒】内出结果！我才毕业。觉得【1毫秒】太快了，真的可以吗？（我们用的是 mysql5 数据库）

      请知道的前辈多说几句，我是一新人。在此先谢过了！

      马上过年了，希望过个开心年啊！！谢谢大家了！

[b]问题补充：[/b]
说老实话。。我也觉得1毫秒绝对不可能。可惜。。。
[b]问题补充：[/b]
问题是用lucene快点还是数据库索引快啊？？
今天又把我留下来学习。，。
叫我去弄。
我本来就是搞java的。喊我自己写索引规则。。
我会个屁啊
[b]问题补充：[/b]
听说：

如果我想找上海酒店，价格在300~500之间。用Lucene处理，它会在内部形成类似这样的查询项：

地点：上海酒店
价格：300

地点：上海酒店
价格：301

…………

地点：上海酒店
价格：500

总共要生成200个这样的查询项，这是倒排索引的机制所限定的。这还算好，如果客户来个100~10000，Lucene就直接挂掉了。

以上是在一个讨论中看到的。。
请问是吗？

如果在我的应用的经纬度的查询中，经纬度是 double的
我想办法把他转成int 在给lucene 索引，那样不是要生成 n万个这样的查询项?

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

4条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
nomoney_boy 2008-12-03 15:30
关注
你通过RangeQuery来做范围查询的话....
RangeQuery是通过BooleanQuery来做的...
每个条件就会加一个BooleanQuery...
BooleanQuery默认最在的条件为1024个.
但是可以通过BooleanQuery.setMaxClauseCount(10000000);来调整...
但是扩大也是有限的，并且随着maxClauseCount扩大，占用内存也扩大

用RangeFilter代替RangeQuery，但是仍然有性能瓶颈，查询的90%以上时间耗费在 RangeFilter，研究其源码发现RangeFilter实际上是首先遍历所有索引，生成一个BitSet，标记每个document，在时间范围内的标记为true，不在的标记为false，然后将结果传递给Searcher查找，这是十分耗时的。

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(3条)

报告相同问题？

关注问题

java lucene如何搜索本地数据库
2024-06-29 02:53

Rich X的博客 数据库相关视频讲解：用python编程Excel有没有用处？Java Lucene如何搜索本地数据库 在实际开发中，我们经常会...本文将介绍如何使用Java Lucene来搜索本地数据库，并提供代码示例来解决这个具体的问题。问题描述...
使用Lucene.NET实现站内搜索
2020-10-24 03:34

在Lucene中，这一步通常涉及到创建一个IndexWriter实例，并指定相应的分析器（Analyzer）、索引目录以及是否是创建新索引还是更新索引。 2. 索引更新：随着网站内容的更新，需要同步更新索引。如果需要更新索引，先...
关于lucene建立数据库索引的更新说明
2012-12-15 15:44

总之，使用Lucene建立数据库索引是一个涉及多方面知识的过程，包括但不限于版本适配、索引策略、用户界面实现、搜索结果处理和分词优化。在实践中，不断学习和交流，结合具体需求调整方法，才能更好地利用Lucene实现...
用lucene对数据库建立索引及搜索
2010-11-16 23:43

使用Lucene.NET对数据库进行索引和搜索，可以极大地提高应用程序的搜索性能，尤其是对于大数据量和复杂查询需求。通过将数据库中的文本数据转换为索引，用户可以快速地找到相关记录，提升用户体验。然而，实际应用时...
Lucene检索数据库支持中文检索.doc
2023-09-22 20:37

总的来说，Lucene通过高效的索引和搜索机制，实现了对数据库中文数据的全文检索。开发者可以通过配置文件管理数据库连接，结合工具类处理索引和搜索过程，实现定制化的搜索功能。在实际项目中，可以根据需求选择合适...
LUCENE索引搜索数据库技术汇总
2012-03-09 20:14

**LUCENE索引搜索数据库技术汇总** Lucene是一个高性能、全文检索库，它是Apache软件基金会的顶级项目，被广泛应用于各种搜索引擎的开发。在学习和应用Lucene的过程中，掌握其核心概念和技术至关重要。以下是对...
Lucene简介与数据库索引
2020-05-25 22:51

得失之道的博客 Lucene是全文检索引擎工具包，他是slor、ElasticSearch的底层，他们各有各的优点但是因为分布式的原因ElasticSearch是明显比slor更深程序员的喜爱，万维网、github、StackOverflow都是使用的ElasticSearch
基于Lucene的Oracle数据库全文检索.pdf
2021-10-10 06:49

基于Lucene的Oracle数据库全文检索是指使用Lucene搜索引擎来实现Oracle数据库中的全文检索。Lucene是一个开源的全文搜索引擎API，提供了完整的查询引擎和索引引擎，部分文本分析引擎。通过使用Lucene，可以对Oracle...
php数据库索引类型,什么是数据库索引？数据库索引详解
2021-04-22 11:31

生活分享家小瑞的博客哈希索引哈希索引是一种自适应的索引，数据库会根据表的使用情况自动生成哈希索引，我们人为是没办法干预的。全文索引用于实现关键词搜索。但它只能根据空格分词，因此不支持中文。若要实现搜索功能，可选择lucene。...
使用Lucene实现一个简单的布尔搜索功能
2020-08-30 20:48

Apache Lucene 是一个高度可扩展的全文检索库，它为开发者提供了一套强大的搜索引擎功能，以便在各种应用程序中实现复杂的全文...无论是在网站、数据库还是企业内部系统中，Lucene 都能提供高效、灵活的全文搜索能力。
没有解决我的问题, 去提问

这样的需求是使用【lucene】还是使用 【数据库索引】

4条回答 默认 最新

这样的需求是使用【lucene】还是使用【数据库索引】

4条回答默认最新