如何提升solr的准群度

solr存储了较多的试题题干信息，使用了ik分词，当输入相同题干的内容作为查询条件去搜索时，原题反而不是第一个，请问哪位知道如何优化？
以下为我的搜索结果:
不一样的题干得分较高，排名靠前

一模一样的题干得分低，排名靠后

目标做到如何让原题排名在最前边

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
阿里嘎多学长 2024-06-17 09:52
关注
以下内容由CHATGPT及阿里嘎多学长共同生成、有用望采纳：

提升Solr搜索引擎的准确度，确保原题干内容在搜索结果中排在最前面，可以通过以下几个步骤进行优化：

调整相似度算法：Solr使用TF-IDF算法来计算文档的得分，但是你也可以使用其他相似度算法，比如ClassicSimilarity或BM25Similarity。BM25算法通常能提供更好的搜索结果，因为它更注重关键词的频率和重要性。

自定义相似度函数：如果内置的相似度算法不能满足需求，你可以自定义相似度函数来调整得分计算方式。

使用Boosting：通过Boosting技术，你可以提高某些字段或文档的权重，使得它们在搜索结果中排名更靠前。例如，你可以对题干字段使用更高的权重。

优化Tokenizer和Filter：虽然你已经使用了ik分词器，但是可能还需要调整Tokenizer和Filter的配置，以确保分词结果更符合你的搜索需求。

使用Phrase Search：如果可能，使用短语搜索而不是单独的关键词搜索，这可以提高搜索的准确性。

调整Query Parser：使用不同的Query Parser，比如edismax，它支持更多的查询特性，比如Boosting和Fuzzy Search。

使用ReRanker：Solr的ReRanker可以在第一轮搜索后，根据某些标准重新对结果进行排序。

分析和优化索引：确保索引的质量和结构，比如使用合适的字段类型，避免过度索引。

使用SpellCheckComponent：如果用户输入有误，SpellCheckComponent可以提供正确的建议，从而提高搜索的准确性。

监控和日志：开启Solr的查询日志，分析用户的查询模式和搜索结果，根据反馈进行调整。

以下是一些示例代码，展示如何在Solr中使用Boosting和调整Query Parser：

 <fieldType name="text_boosted" class="solr.TextField" positionIncrementGap="100"> <analyzer> <tokenizer class="solr.StandardTokenizerFactory"/> <filter class="solr.LowerCaseFilterFactory"/>  </analyzer> </fieldType>  <requestHandler name="/select" class="solr.SearchHandler"> <lst name="defaults"> <str name="echoParams">explicit</str> <str name="queryParser">edismax</str> <str name="defType">edismax</str>  <str name="qf"> boosted_title^2.0 text^1.0 </str> </lst> </requestHandler>

请注意，这些只是一些基本的优化方法，实际的优化可能需要根据你的具体数据和需求进行调整。如果你需要更详细的帮助，可以提供更多的信息，我会尽力提供更具体的指导。
解决无用
评论打赏
分享
举报编辑记录

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

【搜索引擎Solr】Apache Solr 神经搜索
2023-07-24 08:03

架构师研究会的博客 Sease[1] 与 Alessandro Benedetti（Apache Lucene/Solr PMC 成员和提交者）和 Elia Porciani（Sease 研发软件工程师）共同为开源社区贡献了 Apache Solr 中神经搜索的第一个里程碑。它依赖于 Apache Lucene 实现 [2...
【搜索引擎】Apache Solr 神经搜索
2022-06-06 20:23

架构师研究会的博客 Sease[1] 与 Alessandro Benedetti（Apache Lucene/Solr PMC 成员和提交者）和 Elia Porciani（Sease 研发软件工程师）共同为开源社区贡献了 Apache Solr 中神经搜索的第一个里程碑。它依赖于 Apache Lucene 实现 [2...
全文搜索引擎 ElasticSearch 还是 Solr？
2022-02-27 17:33

猿同学的博客阅读文本大概需要 15.2 分钟。前言最近项目组安排了一个任务，项目中用到了基于 Solr 的全文搜索，但是该 Solr 搜索云项目不稳定，经常查询不出来数据，需要手动全量同步。而且它还是...
全文搜索引擎选 ElasticSearch 还是 Solr？
2019-09-04 13:38

图灵学院的博客什么是全文搜索 ...最近项目组安排了一个任务，项目中用到了基于 Solr 的全文搜索，但是该 Solr 搜索云项目不稳定，经常查询不出来数据，需要手动全量同步。而且它还是其他团队在维护，依赖性太强，导致 ...
Solr vs ElasticSearch，搜索技术哪家强
2020-02-12 12:01

朱小厮的博客点击上方“朱小厮的博客”，选择“设为星标”后台回复”加群“获取公众号专属群聊入口Solr和ElasticSearch到底有一些什么不同？我在网上搜索了一些文章，这些文章要么是列出一个表，...
【Docker】Solr容器化部署及配置参数详情
2024-03-17 10:32

轻云UC的博客 Apache Solr 是一个基于 Apache Lucene 构建的极其强大的开源企业搜索平台。它高度可靠、灵活、可扩展，旨在在发布后快速增加价值。
搜索引擎选 ElasticSearch 还是 Solr？
2019-09-25 14:51

田哥coder的博客最近项目组安排了一个任务，项目中用到了基于 Solr 的全文搜索，但是Solr 搜索云项目不稳定，经常查询不出来数据，需要手动全量同步。而且它还是其他团队在维护，依赖性太...
solr7集群 springboot_springboot整合solr
2020-12-23 06:47

weixin_39657521的博客二、复制Solr文件夹中的一些文件到apache-tomcat下:1)将 solr 压缩包中 solr\server\solr-webapp\文件夹下有个webapp文件夹，将之复制到tomcat\webapps\目录下，文件夹名改成solr(任意) ；cp -R ...
【技术选型】Elasticsearch vs. Solr-选择您的开源搜索引擎
2022-01-04 18:48

架构师研究会的博客我们为什么在这里？我存在的目的是什么？我应该运动还是休息并节省能量？早起上班或晚起并整夜工作？我应该将炸薯条和番茄酱或蛋黄酱一起吃吗？...您的组织正在寻求实现您的第一个搜索引擎，并切换到另一个搜索引擎-...
2026 年国产搜索引擎大盘点：Easysearch 凭什么值得关注？
2026-02-25 00:33

铭毅天下的博客技术路线基于 Lucene 深度重构（ES 7.10.2 增强） ES 7.10.2 社区分支自研内核+搜索引擎独立 Lucene 架构 ES API兼容性 ✅ 100% 约 95% 约 70% ≈20%（需大量改造）性能优势写入吞吐提升 40-70%、磁盘压缩提升...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已结题（查看结题原因） 8月2日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 6月17日

如何提升solr的准群度

2条回答 默认 最新

问题事件

2条回答默认最新