confident_f 2011-09-27 17:42
浏览 185
已采纳

lucene建索引的几个问题

1.如何将几个路径下的索引合并到一个统一的路径下并且将原来的索引清除?
2.在搜索的时候term是完全匹配吗?比如我搜索“好”,这个term必须是“好”才能搜索吗?
3.现在搜索的时候要搜“铅笔”,我希望可以搜索与铅笔完全匹配的document,也要搜到与铅,和笔分别匹配的,但是“铅笔”的排在前面,这个用目前的什么分词器可以做到?排序如何实现?
4.对于同一个field里的内容,可以用不同的分词器分析两次吗?同样parsequery的时候可以parse多次吗?

  • 写回答

3条回答

  • aini3456 2011-10-10 17:25
    关注

    搜索的时候也要对用户输入进行分词,且用的分词器应该和索引的时候一样,所以你只输入“铅”是不会把铅笔搜出来的
    一般都中文分词器都不会把固定的词组分开的,像"铅笔"、"中国"都不会拆分的。有需要你可以自己实现一个分词
    模糊搜索用的是FuzzyQuery,我没用过,我想应该对效率会用影响的

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(2条)

报告相同问题?

悬赏问题

  • ¥20 sub地址DHCP问题
  • ¥15 delta降尺度计算的一些细节,有偿
  • ¥15 Arduino红外遥控代码有问题
  • ¥15 数值计算离散正交多项式
  • ¥30 数值计算均差系数编程
  • ¥15 redis-full-check比较 两个集群的数据出错
  • ¥15 Matlab编程问题
  • ¥15 训练的多模态特征融合模型准确度很低怎么办
  • ¥15 kylin启动报错log4j类冲突
  • ¥15 超声波模块测距控制点灯,灯的闪烁很不稳定,经过调试发现测的距离偏大