lawrenst 2009-07-08 11:21
浏览 268
已采纳

Lucene 2.4 搜索结果为空

使用Lucene(2.4)时候出现了搜索结果为空的现象,求达人们解释一下,是程序写的有问题还是我的理解有问题:

在g:\lucene\source下建立了3个txt文件,名称为1.txt,2.txt,abc.txt
其中文件内容均为:
Spring abc

Hibernate abc

Hello
现贴上部分程序代码

建立索引:
File fileDir = new File("g:\lucene\source"); // 指明要索引文件夹的位置
File indexDir = new File("g:\lucene\index"); // 这里放索引文件的位置
File[] textFiles = fileDir.listFiles();

Analyzer analyzer = new StandardAnalyzer();
IndexWriter indexWriter = new IndexWriter(indexDir, analyzer, true,
IndexWriter.MaxFieldLength.LIMITED);
。。。循环目录下的所有文件

Document document = new Document();
Field fieldTitle = new Field("title", textFiles[i].getName(),
Field.Store.YES, Field.Index.ANALYZED,
Field.TermVector.WITH_POSITIONS_OFFSETS);
Field fieldBody = new Field("content", result, Field.Store.YES,
Field.Index.ANALYZED,
Field.TermVector.WITH_POSITIONS_OFFSETS);
document.add(fieldTitle);
document.add(fieldBody);
indexWriter.addDocument(document);

搜索的代码:
String queryString="abc";
IndexSearcher searcher = new IndexSearcher("G:\lucene\index");
Analyzer analyzer = new StandardAnalyzer();
QueryParser parser = new QueryParser("title", analyzer);//当这里是"conten"的时候搜索结果正确
Query query = parser.parse(queryString);
if (searcher != null) {
TopDocs topDocs = searcher.search(query, 100);
System.out.println(topDocs.totalHits);//返回结果为0
...
...
}

在执行搜索的时候,搜索content 域,内容为abc的时候,没有问题,但我想搜索title域,同样搜索内容也是abc,搜索结果始终为0.可是我的文件中明明有一个叫abc.txt啊?这是为什么?

还有,Query和QueryParser的区别,既然有了那么多的Query类,可以不用QueryParser了啊?

求牛人解答。

  • 写回答

1条回答 默认 最新

  • dumb_ness 2009-07-08 21:48
    关注

    这是分词问题,你建立索引时用的是StandardAnalyzer分词器,这是个标准分词器,把一个单词或一个汉字当成一个索引,估计你的文件名"1.txt","2.txt","abc.txt"都被分解成一个索引了,而不是分解成你理解的"abc"、"txt"2个索引.试着搜索"abc.txt"试试.

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

悬赏问题

  • ¥15 oracle集群安装出bug
  • ¥15 关于#python#的问题:自动化测试
  • ¥20 问题请教!vue项目关于Nginx配置nonce安全策略的问题
  • ¥15 教务系统账号被盗号如何追溯设备
  • ¥20 delta降尺度方法,未来数据怎么降尺度
  • ¥15 c# 使用NPOI快速将datatable数据导入excel中指定sheet,要求快速高效
  • ¥15 再不同版本的系统上,TCP传输速度不一致
  • ¥15 高德地图点聚合中Marker的位置无法实时更新
  • ¥15 DIFY API Endpoint 问题。
  • ¥20 sub地址DHCP问题