lucene不能查询出结果(初级问题)

在data文件夹下有4个文件,a.txt,b.txt,c.txt,d.txt.每个文件的内容就是它的文件名,比如a.txt内容就是a.
idx文件夹就是索引存放的文件夹

lucene的索引:
[code="java"]public class Indexer {
public static void main(String[] args) throws Exception {
Indexer indexer = new Indexer();
indexer.index(new File("idx"), new File("data"));
}

public void index(File index, File data) throws Exception {
    IndexWriter indexWriter = new IndexWriter(index,
            new StandardAnalyzer(), true);
    indexWriter.setUseCompoundFile(false);
    indexDirectory(indexWriter, data);
    indexWriter.optimize();
    indexWriter.close();
}

public void indexDirectory(IndexWriter indexWriter, File data)
        throws IOException {
    if (data.isFile()) {
        indexFile(indexWriter, data);
    } else if (data.isDirectory()) {
        File[] files = data.listFiles();
        for (File file : files) {
            indexDirectory(indexWriter, file);
        }
    }
}

public void indexFile(IndexWriter indexWriter, File data)
        throws IOException {
    Document doc = new Document();
    doc.add(Field.Text("contents", new FileReader(data)));
    doc.add(Field.Keyword("filename", data.getCanonicalPath()));
    indexWriter.addDocument(doc);
}

}
[/code]
lucene的search:
[code="java"]public class Searcher {
public static void main(String[] args) throws Exception {
Searcher searcher = new Searcher();
searcher.search(new File("idx"), "a");
}

public void search(File index, String str) throws Exception {
    Directory directory = FSDirectory.getDirectory(index, false);
    IndexSearcher indexSearcher = new IndexSearcher(directory);
    Query query = QueryParser
            .parse(str, "contents", new StandardAnalyzer());
    Hits hits = indexSearcher.search(query);
    System.out.println(hits.length());
    for (int i = 0; i < hits.length(); i++) {
        Document document = hits.doc(i);
        System.out.println(document.getField("contents"));
        System.out.println(document.getFields("filename"));
    }
}

}
[/code]
索引文件和数据文件的路径都没有问题,已经经过测试,并且经过索引过后都可以产生索引文件,但是在searcher时,始终hit.length=0,不知道为什么?
(使用的是lucene-1.4)
[b]问题补充：[/b]
现在比较常用的analyzer是什么?a是stopword,但是假如写成cat,就应该能识别出这是2个词是c和t啊.可事实并非如此.lucene1.4虽然老了点，可仍然是使用较多的版本啊.

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
jolestar 2008-08-05 16:38
关注
a 是StandardAnalyzer的默认stopword，会被过滤掉，所以你搜索不出来内容。
要么换个analyzer,要么用个别的词做测试。
ps：你的lucene版本也太老了点。

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

lucene-初级学习资料.ppt
2023-09-22 20:31

Lucene 是一个强大的全文搜索引擎库，它是用 Java 编写的开放源代码...同时，了解其他相关技术，如 Solr 和 Elasticsearch 这样的基于 Lucene 的全文搜索引擎平台，能帮助你更好地运用 Lucene 并解决更复杂的搜索问题。
Lucene初探，一个初级的LuceneDemo
2019-03-16 01:12

**Lucene初探：一个初级的LuceneDemo** 在IT领域，搜索引擎技术是不可或缺的一部分，尤其是在大数据时代，高效的信息检索显得尤为重要。Apache Lucene就是这样一款强大的开源全文搜索引擎库，它为开发者提供了构建...
java Lucene初级教程
2015-11-27 15:01

因此它并不像www.baidu.com 或者google Desktop那么拿来就能用，它只是提供了一种工具让你能实现这些产品。 2 lucene的工作方式 lucene提供的服务实际包含两部分：一入一出。所谓入是写入，即将你提供的源（本质是...
Lucene初级教程
2012-04-01 12:55

### Lucene初级教程知识点详解 #### 1. Lucene简介 - **1.1 什么是Lucene** - Lucene是一种高性能的全文检索框架，它主要用于构建搜索引擎的基础架构。与百度或Google Desktop这类直接可用的应用产品不同，Lucene...
Lucene初级教程.pdf
2021-10-30 15:26

### Lucene初级教程知识点概述 #### 1. Lucene简介 - **定义**: Lucene是一个开源的全文搜索引擎库，主要用于构建应用程序的搜索功能。与直接使用的搜索引擎产品不同，Lucene提供了一个开发平台，让开发者能够根据...
【全文检索技术】基于Lucene的倒排索引机制与分词检索实现：Java平台高性能信息查询系统设计
2026-01-10 14:57

报告详细阐述了Lucene的倒排索引机制、分词处理、索引创建与检索查询的工作流程，并通过代码示例展示了索引构建和关键词搜索的具体实现。同时，文章说明了Lucene的多语言适配性、灵活扩展架构及其在Elasticsearch、...
Lucene初级教程.doc
2019-04-10 01:51

标题为“Lucene初级教程.doc”，我们可以推断这是一份关于Lucene的入门级文档，Lucene是Apache软件基金会的一个开放源代码项目，它是一个全文搜索引擎库，广泛应用于Java开发中，用于实现高效、可扩展的信息检索服务...
lucene 初级教程
2012-03-22 14:22

### Lucene初级教程知识点 #### 1. Lucene简介 - **1.1 什么是Lucene** - Lucene是一个开源的全文检索引擎工具包，主要用于构建搜索应用程序的基础架构。与成品搜索引擎（如Google或Baidu）不同，Lucene提供了一个...
Lucene分词原理与实现：搜索技术的基石
2025-07-06 15:13

AI 搜索引擎技术的博客在搜索引擎的世界里，分词是让机器“理解”人类语言的第一步。...无论你是搜索系统开发者，还是想理解“为什么搜‘苹果’能找到手机也能找到水果”的技术爱好者，本文都将为你揭开搜索技术的第一块基石。
lucene搜索引擎的初级使用
2015-08-09 13:57

嗡汤圆的博客使用lucene检索引擎可以十分方便的满足全文检索需求。
没有解决我的问题, 去提问

lucene不能查询出结果(初级问题)

1条回答 默认 最新

1条回答默认最新