关于lucene+IK分词，查询条件越长，查询结果越多的问题怎么破

如题，lucene+IK分词实现检索功能，目的是比数据库查询快的多，但是问题来了，如：我输入“小米”查询企业信息列表，返回了**小米**XXXXX公司、**小米**XXXXX服务公司。。。。。，我输入“小米科技”，返回了**小米**XXXXX公司、**小米**XXXXX服务公司、XXX百度**科技**XXXX公司，输入越精确分词返回结果集越多，想想觉得不太合理，希望将分词后返回包含所有分词后小词条的结果，但是没找到相应的办法，不知道有没坛友遇到类似问题有解决经验的，求指引！

PropKit.use(ConstantConfig.CONFIG_PROPERTIES);
Directory dir = FSDirectory.open(Paths.get(PropKit.get(ConstantConfig.LUCENCE_PATH)));// 打开索引目录
IndexSearcher isearcher = new IndexSearcher(DirectoryReader.open(dir));// search对象
IKAnalyzer analyzer = new IKAnalyzer(false);// IK分词器
// KeywordAnalyzer analyzer = new KeywordAnalyzer();
// StandardAnalyzer analyzer = new StandardAnalyzer();

List fieldNameList = new ArrayList();
List fieldValueList = new ArrayList();
fieldNameList.add(ConstantField.STATUS_CODE);
fieldValueList.add(StatusCode.STATUS_NORMAL.getValue());
fieldNameList.add("spName");
fieldValueList.add("小米科技");
// 分页查询
TopFieldCollector c = TopFieldCollector.create(new Sort(SortField.FIELD_SCORE), 50, false, false, false);

if (fieldNameList.size() < 1) {
isearcher.search(new MatchAllDocsQuery(), c);
} else {
String[] queries = new String[fieldNameList.size()];
String[] fields = new String[fieldNameList.size()];
BooleanClause.Occur[] clauses = new BooleanClause.Occur[fieldNameList.size()];

for (int i = 0; i < fieldNameList.size(); i++) {
queries[i] = fieldValueList.get(i);
fields[i] = fieldNameList.get(i);
clauses[i] = BooleanClause.Occur.MUST;
}
//多字段查询

QueryParser parser=new MultiFieldQueryParser(new String[]{""}, analyzer);

Query query = MultiFieldQueryParser.parse(queries, fields, clauses, analyzer);
isearcher.search(query, c);
}
System.out.println(c.getTotalHits());
ScoreDoc[] hits = c.topDocs(0, 50).scoreDocs;

List> dataList = new ArrayList>();
Map entity;
for (int i = 0; i < hits.length; i++) {
Document doc = isearcher.doc(hits[i].doc);
entity = new HashMap();
entity.put("spName", doc.get("spName"));
dataList.add(entity);
}
System.out.println(JSON.toJSON(dataList).toString());

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
Little_Cigar 2017-12-05 07:59
关注
IK分词器本来就是按照词组分类的，你查询的关键词/句中只要包含那个词语就都能被查到

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

lucene+springboot+vue查询接口怎么编写 lucene spring boot vue.js
2022-11-27 15:54

回答 1 已采纳你看下这篇博客吧, 应该有用👉 ：Lucene+springboot 实现一个简单的搜索
关于lucene的多条件查询问题 lucene
2015-08-31 10:01

回答 1 已采纳 ![图片说明](https://img-ask.csdn.net/upload/201508/31/1441015301_927666.png) 我现在这么写的效果是and es.city=1031
lucene多条件搜索时or与and问题 lucene
2013-06-08 08:23

回答 3 已采纳 should戴表两个字段中必须有一个..must是必须都存在...你看看大小写啥的..有可能建索引的时候全都小写了
“Elasticsearch + Kibana + ik分词器“介绍与使用
2022-06-02 22:59

程序没有缘的博客 Elasticsearch 是一个分布式、RESTful 风格的搜索和数据分析引擎，能够解决不断涌现出的各种用例。作为 Elastic Stack 的核心，它集中存储您的数据，帮助您发现意料之中以及意料之外的情况。
lucene不分词如果实现模糊查询 lucene
2013-09-20 10:06

回答 1 已采纳查询用* ，还要看你是什么版本
请教一下lucene4.x下精确与模糊组合查询怎么写？ lucene
2014-10-19 12:24

回答 1 已采纳建议直接用solr或者es。想精确查找，对应的索引字段应不分词，模糊就分词。
关于lucene.net站内搜索的简单问题
2016-05-06 06:08

回答 1 已采纳是中文么，中文需要分词。参考：http://www.cnblogs.com/lhj588/archive/2013/02/06/2900937.html
ik分词和jieba分词哪个好_Lucene.net(4.8.0) 学习问题记录五: JIEba分词和Lucene的结合，以及对分词器的思考...
2020-12-20 20:28

weixin_39634997的博客前言：目前自己在做使用Lucene.net和PanGu分词实现全文检索的工作，不过自己是把别人做好的项目进行迁移。因为项目整体要迁移到ASP.NET Core 2.0版本,而Lucene使用的版本是3.6.0 ，PanGu分词也是对应Lucene3.6.0版本...
Lucene的Demo，查询不出来数据 lucene
2017-07-03 05:19

回答 2 已采纳我猜想分词出现的问题，你可以下个luke去查看分词的情况
lucene不能查询出结果(初级问题) lucene
2008-08-04 20:34

回答 1 已采纳 a 是StandardAnalyzer的默认stopword，会被过滤掉，所以你搜索不出来内容。要么换个analyzer,要么用个别的词做测试。 ps：你的lucene版本也太老了点。
lucene在结果中多次检索问题 lucene
2014-03-12 14:38

回答 1 已采纳 lucene貌似是不支持这样的模式，但是可以考虑将第一次的搜索条件缓存、二次搜索时将两个搜索条件拼接在一起搜索，效果应该是类似的。
Elasticsearch - IK分词器；文档得分机制（十一）
2022-09-18 21:10

MinggeQingchun的博客 1、首先进入 ES 根目录中的 plugins 文件夹下的 ik 文件夹，进入 config 目录，创建 custom.dic 文件，写入"一个学生"2、打开 IKAnalyzer.cfg.xml 文件，将新建的 custom.dic 配置其中，重启 ES 服务器重启服务器，...
具有多个条件的PHP Zend Lucene搜索查询失败 php
2011-10-27 10:58

回答 2 已采纳 I had solved this problem by using Zend Query Parsing $strQuery = Zend_Search_Lucene_Search_Query
ik分词器 mysql php_ES在MySQL、PHP中的使用
2021-02-01 05:17

weixin_39791322的博客全文检索是指计算机索引程序通过扫描文章中的每一个词，对每一个词建立一个索引，指明该词在文章中出现的次数和位置，当用户查询时，检索程序就根据事先建立的索引进行查找，并将查找的结果反馈给用户的检索方式。...
Elasticsearch 7.8.1 创建索引，IK分词器的使用
2021-11-22 14:50

符文大法师的博客前置知识来自：图解Elasticsearch中的_source、_all、store和index属性_1.02^365=1377.41 (Lucene、ES、ELK开发交流群: 370734940, 公众号:搜索算法)-CSDN博客部分内容整理自：Elasticsearch 7.8 索引创建 / 数据...
没有解决我的问题, 去提问

悬赏问题

¥15 #MATLAB仿真#车辆换道路径规划
¥15 java 操作 elasticsearch 8.1 实现索引的重建
¥15 数据可视化Python
¥15 要给毕业设计添加扫码登录的功能！！有偿
¥15 kafka 分区副本增加会导致消息丢失或者不可用吗？
¥15 微信公众号自制会员卡没有收款渠道啊
¥100 Jenkins自动化部署—悬赏100元
¥15 关于#python#的问题：求帮写python代码
¥20 MATLAB画图图形出现上下震荡的线条
¥15 关于#windows#的问题：怎么用WIN 11系统的电脑克隆WIN NT3.51-4.0系统的硬盘

关于lucene+IK分词，查询条件越长，查询结果越多的问题怎么破

1条回答 默认 最新

悬赏问题

1条回答默认最新