Lucene中demo：IndexHTML.java问题

我用Lucene2.4中HTML的例子，给一写网页建立索引。之后搜索不到网页上的内容，但是txt文档的内容可以搜索到。
这是为什么啊
[b]问题补充：[/b]
98687190 (中级程序员) ，
域和索引的目录都是正确的。
麻烦解释下“是否多条件查询的时候关系弄错了？比如Occur.MUST。”
Occur.MUST这个是什么？ :)
[b]问题补充：[/b]
补充2：
import jeasy.analysis.MMAnalyzer;

import org.apache.lucene.analysis.SimpleAnalyzer;
import org.apache.lucene.analysis.standard.StandardAnalyzer;
import org.apache.lucene.queryParser.QueryParser;
import org.apache.lucene.search.*;

public class Test {
public static void main(String[] args) throws Exception {
String indexPath = "d:/index", queryString = "我"; //指向索引目录的搜索器
Searcher searcher = new IndexSearcher(indexPath); //查询解析器：使用和索引同样的语言分析器
QueryParser qp = new QueryParser("contents",new SimpleAnalyzer());
String temp = "+(path:"+queryString+"* contents:"+queryString+"*)";
Query query = qp.parse(temp); //搜索结果使用Hits存储
Hits hits = searcher.search(query); //通过hits可以访问到相应字段的数据和查询的匹配度
System.out.println(hits.length());
for (int i=0; i<hits.length(); i++) {
System.out.println(hits.doc(i).get("path") + "; Score: " + hits.score(i));
System.out.println(hits.doc(i).get("contents"));
System.out.println(hits.doc(i).get("modified"));
System.out.println(hits.doc(i).get("uid"));
System.out.println(hits.doc(i).get("summary"));
System.out.println(hits.doc(i).get("title"));
}
}
}
[b]问题补充：[/b]
98687190请帮忙看看， :arrow:
[b]问题补充：[/b]
“还有String temp = "+(path:"+queryString+"* contents:"+queryString+"*)"; 第一次见用这样的写法。 ”
呵呵，因为看到过帖子。部分如下：
TermQuery可以用“field:key”方式，例如“content:lucene”。
BooleanQuery中‘与’用‘+’，‘或’用‘ ’，例如“content:java contenterl”。
WildcardQuery仍然用‘?’和‘*’，例如“content:use*”。
PhraseQuery用‘~’，例如“content:"中日"~5”。
PrefixQuery用‘*’，例如“中*”。
FuzzyQuery用‘~’，例如“content: wuzza ~”。
RangeQuery用‘[]’或‘{}’，前者表示闭区间，后者表示开区间，例如“time:[20060101 TO 20060130]”，注意TO区分大小写。
而且在索引txt文档的时候，这种方法也很简洁就用了。

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
weixin_42348590 2009-02-04 13:44
关注
QueryParser qp = new QueryParser("contents",new SimpleAnalyzer());

你建立索引时候是new SimpleAnalyzer()？？？
建议换一下StandardAnalyzer试试？

还有String temp = "+(path:"+queryString+"* contents:"+queryString+"*)"; 第一次见用这样的写法。
干脆把
[code="java"]String temp = "+(path:"+queryString+"* contents:"+queryString+"*)";
Query query = qp.parse(temp); //搜索结果使用Hits存储
Hits hits = searcher.search(query); //通过hits可以访问到相应字段的数据和查询的匹配度 [/code]
换成
[code="java"]
BooleanQuery query = new BooleanQuery()
QueryParser parser1 = new QueryParser("path", analyzer);
QueryParser parser2 = new QueryParser("contents", analyzer);
query.add(parser1.parse(queryString),Occur.SHOULD);//检索path中是否出现关键词，Occur.MUST就是关键词必须在域中检索出。
query.add(parser2.parse(queryString),Occur.MUST);//检索path中是否出现关键词，必须匹配contents
Hits hits = searcher.search(query);//现场写的，不一定用BooleanQuery，但BooleanQuery 比较灵活点
[/code]

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(2条)

报告相同问题？

关注问题

java lucene demo,lucene自带的两个demo的运行测试方法
2021-04-22 05:00

时光里的沙漏的博客首先学习了中文java上的为自己的系统搞个全文搜索、车东的基于Java的全文索引引擎Lucene简介和竹笋炒肉的lucene学习笔记对lucene的原理有个一个全局的认识。下面是对lucene自带的两个demo的运行测试方法：一、...
java lucene 例子,lucene自带例子的配置运行
2021-04-17 04:50

村姑沙拉的博客我下载的lucene-1.4.3版本，环境为JDK1.5 ,Tomcat5.5假设tomcat 安装目录为C:\Tomcat前提：把lucene-1.4.3.jar和lucene-demos-1.4.3.jar加入到环境变量的classpath变量里1.把luceneweb.war放到 C:\Tomcat\webapps\下...
lucene搜索html文件,使用Lucene对html文件进行索引
2021-06-12 18:15

买报纸的小女孩的博客我修改了lucene的demo包的IndexHTML类，使其可以被其他Java类调用。IndexHTML类import org.apache.lucene.analysis.standard.StandardAnalyzer;import org.apache.lucene.document.Document;import org.apache....
Lucene-3.0.0+Tomcat集成.doc
2011-09-29 14:51

- **建立索引**：使用命令`java org.apache.lucene.demo.IndexHTML-create-index [索引数据存放路径] [被索引文件路径]`。 - **执行查询**： - 打开浏览器访问`http://localhost:8080/luceneweb`。 - 在页面中输入...
Lucene demo调试运行：
2012-09-01 10:47

a52071453的博客 Lucene demo调试运行：运行环境：　JDK 1.5 TOMCAT 5.5 Eclipse 3.0.1 解压lucene1.4.3 把luceneweb.war复制到tomcat的webapps目录,重新启动tomcat，就可以看到目录下多了一个luceneweb目录新建一...
lucene 教程详解
2011-11-02 17:21

- **建立索引**：运行命令`java org.apache.lucene.demo.IndexHTML-create-index [索引数据存放路径] [被索引文件路径]`，例如`java org.apache.lucene.demo.IndexHTML-create-index D:\lucene\temp\index D:\...
lucene安装配置及demo调试
2014-04-15 13:42

weixin_34163741的博客 >java org.apache.lucene.demo.IndexHTML -create -index C:/opt/lucene/index .. step5.执行查询 http://localhost:8080/luceneweb step6.如果上一步执行失败，报出无法找到index目录的信息修改/...
Lucene教程详解
2017-11-28 14:24

dandongsoft的博客注明：本文是由本人在开发有关基于lucene资源检索系统时的一点总结，其中一部分是自己根据开发过程自己总结的，也有部分是摘自网络，因无法获取当时摘文的地址，所以在此没有写源地址。转载请声明出处 ...
lucene的demo环境搭建
2010-07-06 10:43

smeyou的博客关键字: lucene 总结一下lucene的环境搭建，查看以及了解lucene的原理，对其有个大概的了解。 1、下载lucene2.3.2 地址：...
lucene 3.0 中的demo项目部署
2010-10-12 11:52

cnsd007的博客 1 在myEclipise 建立一个web 工程，将lucene-3.0.2\src中的code 粘贴到 src中。将lucene-3.0.2\src\jsp下面的文件黏贴到 webroot 下面，将 lucene-core-3.0.2.jar;lucene-demos-3.0.2.jar 拷贝的lib下，添加jar 在...
没有解决我的问题, 去提问

Lucene中demo：IndexHTML.java问题

3条回答 默认 最新

3条回答默认最新