lawrenst 2009-07-08 11:21
浏览 268
已采纳

Lucene 2.4 搜索结果为空

使用Lucene(2.4)时候出现了搜索结果为空的现象,求达人们解释一下,是程序写的有问题还是我的理解有问题:

在g:\lucene\source下建立了3个txt文件,名称为1.txt,2.txt,abc.txt
其中文件内容均为:
Spring abc

Hibernate abc

Hello
现贴上部分程序代码

建立索引:
File fileDir = new File("g:\lucene\source"); // 指明要索引文件夹的位置
File indexDir = new File("g:\lucene\index"); // 这里放索引文件的位置
File[] textFiles = fileDir.listFiles();

Analyzer analyzer = new StandardAnalyzer();
IndexWriter indexWriter = new IndexWriter(indexDir, analyzer, true,
IndexWriter.MaxFieldLength.LIMITED);
。。。循环目录下的所有文件

Document document = new Document();
Field fieldTitle = new Field("title", textFiles[i].getName(),
Field.Store.YES, Field.Index.ANALYZED,
Field.TermVector.WITH_POSITIONS_OFFSETS);
Field fieldBody = new Field("content", result, Field.Store.YES,
Field.Index.ANALYZED,
Field.TermVector.WITH_POSITIONS_OFFSETS);
document.add(fieldTitle);
document.add(fieldBody);
indexWriter.addDocument(document);

搜索的代码:
String queryString="abc";
IndexSearcher searcher = new IndexSearcher("G:\lucene\index");
Analyzer analyzer = new StandardAnalyzer();
QueryParser parser = new QueryParser("title", analyzer);//当这里是"conten"的时候搜索结果正确
Query query = parser.parse(queryString);
if (searcher != null) {
TopDocs topDocs = searcher.search(query, 100);
System.out.println(topDocs.totalHits);//返回结果为0
...
...
}

在执行搜索的时候,搜索content 域,内容为abc的时候,没有问题,但我想搜索title域,同样搜索内容也是abc,搜索结果始终为0.可是我的文件中明明有一个叫abc.txt啊?这是为什么?

还有,Query和QueryParser的区别,既然有了那么多的Query类,可以不用QueryParser了啊?

求牛人解答。

  • 写回答

1条回答 默认 最新

  • dumb_ness 2009-07-08 21:48
    关注

    这是分词问题,你建立索引时用的是StandardAnalyzer分词器,这是个标准分词器,把一个单词或一个汉字当成一个索引,估计你的文件名"1.txt","2.txt","abc.txt"都被分解成一个索引了,而不是分解成你理解的"abc"、"txt"2个索引.试着搜索"abc.txt"试试.

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

悬赏问题

  • ¥50 关于#html5#的问题:H5页面用户手机返回的时候跳转到指定页面例如(语言-javascript)
  • ¥15 无法使用此凭据登录,因为你的域不可用,如何解决?(标签-Windows)
  • ¥15 yolov9的训练时间
  • ¥15 二叉树遍历没有报错但无法正常运行
  • ¥15 在linux系统下vscode运行robocup3d上场球员报错
  • ¥15 Python语言实验
  • ¥15 SAP HANA SQL 增加合计行
  • ¥20 用C#语言解决一个英文打字练习器,有偿
  • ¥15 srs-sip外部服务 webrtc支持H265格式
  • ¥15 在使用abaqus软件中,继承到assembly里的surfaces怎么使用python批量调动