使用lucene和paoding建立索引报错

这是其中的创建索引的代码：大家帮忙看下吧
package com.foresee.paodinganalyzer;

import java.io.File;
import java.io.FileReader;
import java.io.IOException;
import java.util.Date;

import net.paoding.analysis.analyzer.PaodingAnalyzer;

import org.apache.lucene.document.Document;
import org.apache.lucene.document.Field;
import org.apache.lucene.index.IndexWriter;
import org.apache.lucene.store.FSDirectory;

public class CreateIndexer {

/**
 * @param args
 */
private static String INDEX_DIR = "e:\\mypaoding\\index\\";// 索引存放目录
private static String DATA_DIR = "e:\\mypaoding\\small\\";// 原文件存放路径

public static void main(String[] args) throws IOException {
    // TODO Auto-generated method stub
    long start = new Date().getTime();
    int numIndexed = index(new File(INDEX_DIR), new File(DATA_DIR));// 调用index方法
    long end = new Date().getTime();
    System.out.println("Indexing " + numIndexed + " files took "
            + (end - start) + " millseconds");
}

private static int index(File indexDir, File dataDir) throws IOException {
    // TODO Auto-generated method stub
    if (!dataDir.exists() || !dataDir.isDirectory()) {
        throw new IOException(dataDir
                + " does not exist or is not a directory");
    }
    IndexWriter iw = new IndexWriter(FSDirectory.open(indexDir),
            new PaodingAnalyzer()/*new StandardAnalyzer(Version.LUCENE_30)*/, true, IndexWriter.MaxFieldLength.LIMITED);
    indexDirectory(iw, dataDir);
    int numIndexed = iw.numDocs();
    iw.optimize();
    iw.close();
    return numIndexed;
}

/**
 * 循环遍历目录下的所有.txt文件并进行索引
 * 
 * @param iw
 * @param dataDir
 * @throws IOException
 */
private static void indexDirectory(IndexWriter iw, File dataDir)
        throws IOException {
    // TODO Auto-generated method stub
    File[] files = dataDir.listFiles();
    for (int i = 0; i < files.length; i++) {
        File f = files[i];
        if (f.isDirectory()) {
            indexDirectory(iw, f);// 递归遍历
        } else if (f.getName().endsWith(".txt")) {
            indexFile(iw, f);
        }
    }
}

private static void indexFile(IndexWriter iw, File f) throws IOException {
    // TODO Auto-generated method stub
    if (f.isHidden() || !f.exists() || !f.canRead()) {
        return;
    }
    System.out.println("Indexing " + f.getCanonicalPath());
    Document doc = new Document();
    doc.add(new Field("contents", new FileReader(f)));// 有变化的地方
    doc.add(new Field("filename", f.getCanonicalPath(), Field.Store.YES,
            Field.Index.ANALYZED));// 有变化的地方
    iw.addDocument(doc);
}

}
下面是报错的信息：
2010-3-10 9:16:00 net.paoding.analysis.knife.PaodingMaker getProperties
信息: config paoding analysis from: D:\workspace\PaodingAnalyzer\file:\E:\jar\pading\paoding-analysis.jar!\paoding-analysis.properties;D:\workspace\PaodingAnalyzer\file:\E:\jar\pading\paoding-analysis.jar!\paoding-analysis-default.properties;D:\workspace\PaodingAnalyzer\file:\E:\jar\pading\paoding-analysis.jar!\paoding-analyzer.properties;D:\workspace\PaodingAnalyzer\bin\paoding-dic-home.properties;E:\data\paoding\dic\paoding-dic-names.properties;D:\workspace\PaodingAnalyzer\file:\E:\jar\pading\paoding-analysis.jar!\paoding-knives.properties;D:\workspace\PaodingAnalyzer\file:\E:\jar\pading\paoding-analysis.jar!\paoding-knives-user.properties
2010-3-10 9:16:00 net.paoding.analysis.knife.PaodingMaker createPaodingWithKnives
信息: add knike: net.paoding.analysis.knife.CJKKnife
2010-3-10 9:16:00 net.paoding.analysis.knife.PaodingMaker createPaodingWithKnives
信息: add knike: net.paoding.analysis.knife.LetterKnife
2010-3-10 9:16:00 net.paoding.analysis.knife.PaodingMaker createPaodingWithKnives
信息: add knike: net.paoding.analysis.knife.NumberKnife
Indexing E:\mypaoding\small\girl0.txt
Exception in thread "main" java.lang.AbstractMethodError: org.apache.lucene.analysis.TokenStream.incrementToken()Z
at org.apache.lucene.index.DocInverterPerField.processFields(DocInverterPerField.java:137)
at org.apache.lucene.index.DocFieldProcessorPerThread.processDocument(DocFieldProcessorPerThread.java:246)
at org.apache.lucene.index.DocumentsWriter.updateDocument(DocumentsWriter.java:773)
at org.apache.lucene.index.DocumentsWriter.addDocument(DocumentsWriter.java:751)
at org.apache.lucene.index.IndexWriter.addDocument(IndexWriter.java:1928)
at org.apache.lucene.index.IndexWriter.addDocument(IndexWriter.java:1902)
at com.foresee.paodinganalyzer.CreateIndexer.indexFile(CreateIndexer.java:81)
at com.foresee.paodinganalyzer.CreateIndexer.indexDirectory(CreateIndexer.java:66)
at com.foresee.paodinganalyzer.CreateIndexer.index(CreateIndexer.java:43)
at com.foresee.paodinganalyzer.CreateIndexer.main(CreateIndexer.java:29)

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
iteye_13500 2010-03-14 22:34
关注
庖丁提供了例子的，你看看例子里面用的是Lucene哪个版本的，你就找哪个版本吧，lucene 各版本都有不小改动，兼容性方面做的不好。

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

报告相同问题？

关注问题

使用lucene和paoding建立索引报错 lucene
2010-03-10 09:25

回答 2 已采纳庖丁提供了例子的，你看看例子里面用的是Lucene哪个版本的，你就找哪个版本吧，lucene 各版本都有不小改动，兼容性方面做的不好。
学习lucene建立检索和搜索过程中遇到的错误 lucene
2014-04-24 17:52

回答 2 已采纳 Query query = parser.parse("document.txt"); 用全名称来搜，或者Query query = parser.parse("document*"); 因为St
java lucene的搜索和翻页效率？ java lucene
2018-05-09 07:26

回答 3 已采纳检索分页本来就很慢,你没觉得百度只有前几页的数据有效，后几页的数据基本就没用或者和前几页很一样
lucene使用
2021-01-02 17:20

我愿成为你头顶的云的博客基本上我们每个人每天都会或多或少的用到搜索引擎，百度的、谷歌的、360搜索，或者其他的。我们在搜索框内输入关键字然后点击搜索，搜索引擎会将与关键字匹配度最高的内容搜索到然后返回给我们。电影网站的搜索功能...
lucene怎样将文档中一部分内容建立索引？ lucene
2012-06-01 09:56

回答 1 已采纳我感觉不用读出来再存文件吧,直接把读出来的内容简历索引呢,
Lucene索引和检索中文文件的问题 lucene
2013-04-16 21:58

回答 3 已采纳 SearcherUtil 的索引目录错了 directory = FSDirectory.open(new File("F:/Lucene/test/indexDir1.2"));
如何不用建立lucene索引的问题？ lucene
2011-08-12 19:49

回答 4 已采纳 [quote] 我的意思是，第一次建立了索引以后，下一次我访问的时候，如何不用再建立所以，直接去查询。因为发现每次调用都必须new indexwrite。时间都花费在这个地方建立索引。索引建立完
用solr从数据库建立中文Lucene索引
2011-03-07 20:07

caoliangbo的博客用solr从数据库建立中文Lucene索引 Solr是一个基于Lucene java库的企业级搜索服务器，运行在Servlet容器中。 1. 下载solr: http://www.apache.org/dyn/closer.cgi/lucene/solr/ 当前最新版是1.4 ...
lucene怎样在做增量索引的同时更新旧数据？ lucene
2013-05-06 14:20

回答 1 已采纳方案1: 你修改的数据加一个触发器如果你要索引的字段被改动后把id插入另一张表里然后跑定时任务根据这些ID查找出要索引的数据定时的构建索引然后再把这些IDdelete掉方案2
lucene5.4 中文单字搜索命中为0 lucene
2017-05-20 13:36

回答 2 已采纳给你看我做百度网盘的时候用到lucene做的工具类， ``` /** * 索引类 * @author user * */ public class PanIndex {
lucene更新索引，被更新索引的还在，还能被搜索到 lucene
2011-08-22 11:52

回答 5 已采纳删除的还在，那是你根本没删除掉。删除数据时候一定要保持数据库，缓存和索引都删除干净。
Lucenesolr
2022-04-27 10:12

BoltBear的博客 Lucene 全文检索技术课程计划 Lucene介绍全文检索流程介绍索引流程搜索流程 Lucene入门程序索引实现搜索实现分词器分词介绍 IK分词器搜索技术理论基础为什么要学习...
关于java搜索引擎lucene为数据库做索引的一点不解？ lucene
2009-07-24 09:37

回答 1 已采纳利用lucene之类的搜索引擎达到的效果和数据库查询优势是什么啊 lucene 比数据库查询要快. 数据库查询搜索相关文本只能用 like ,like 不用使用索引,全文索引慢.
LUCENE 3.6 学习笔记
2013-08-06 10:49

会飞的刺猬的博客目前，主流的全文索引工具有：Lucene , Sphinx , Solr , ElasticSearch。其中Solr和Elastic Search都是基于Lucene的。Sphinx不是 apache的项目，如果你想把Sphinx放到某个商业性的项目中，你就得买个商业许可证。 ...
SolrCloud部署和使用手册
2015-04-11 08:40

thunder4393的博客 Solr是一个高性能，采用Java开发，基于Lucene的全文搜索服务器。同时对其进行了扩展，提供了比Lucene更为丰富的查询语言，同时实现了可配置、可扩展并对查询性能进行了优化，并且提供了一个完善的功能管理界面，是一...
没有解决我的问题, 去提问

悬赏问题

¥15 matlab有关常微分方程的问题求解决
¥15 perl MISA分析p3_in脚本出错
¥15 k8s部署jupyterlab，jupyterlab保存不了文件
¥15 ubuntu虚拟机打包apk错误
¥199 rust编程架构设计的方案有偿
¥15 回答4f系统的像差计算
¥15 java如何提取出pdf里的文字？
¥100 求三轴之间相互配合画圆以及直线的算法
¥100 c语言，请帮蒟蒻写一个题的范例作参考
¥15 名为“Product”的列已属于此 DataTable

使用lucene和paoding建立索引报错

2条回答 默认 最新

悬赏问题

2条回答默认最新