java lucene的搜索和翻页效率？

lucene上千万的数据翻页怎么这么慢啊，基本上要5s-6s。前面的页数还比较快，越到后面的页数翻页越慢。
贴上代码:
方式一:

 public static void searchPage(int pageIndex,int pageSize) throws IOException, ParseException{
        Date start=new Date();
        Directory dir=FSDirectory.open(Paths.get("D:\\FCJS\\FCJS_bigdata_lucene5.3.0"));
        IndexReader reader = DirectoryReader.open(dir);
        IndexSearcher searcher=new IndexSearcher(reader);
        Analyzer analyzer=new IKAnalyzer(false);//false细粒度分词，true智能分词
        QueryParser parser=new QueryParser("all", analyzer);
        Query query=parser.parse("all");
        TopDocs tds = searcher.search(query,Integer.MAX_VALUE);
        ScoreDoc[] sds = tds.scoreDocs;
        int page_start = (pageIndex-1)*pageSize;  
        int page_end = pageIndex*pageSize;
        for(int i=page_start;i<page_end;i++) {  
            Document doc = searcher.doc(sds[i].doc);  
            System.out.println(sds[i].doc+":"+doc.get("ArticleID"));  
        }
        Date end=new Date();
        System.out.println("耗时："+(end.getTime()-start.getTime())+"ms");
    }

方式二：

 private static void searchPageByAfter(int pageIndex,int pageSize) throws IOException, ParseException{
        Date start=new Date();
        Directory dir=FSDirectory.open(Paths.get("D:\\FCJS\\FCJS_bigdata"));
        IndexReader reader = DirectoryReader.open(dir);
        IndexSearcher searcher=new IndexSearcher(reader);
        Analyzer analyzer=new IKAnalyzer(false);//false细粒度分词，true智能分词
        QueryParser parser=new QueryParser("all", analyzer);
        Query query=parser.parse("all");
        //获取上一页的最后一个元素  
        ScoreDoc lastSd = getLastScoreDoc(pageIndex, pageSize, query, searcher); 
      //通过最后一个元素去搜索下一页的元素  
        TopDocs tds = searcher.searchAfter(lastSd,query, pageSize);
        for(ScoreDoc sd:tds.scoreDocs) {  
            Document doc = searcher.doc(sd.doc);  
            System.out.println(sd.doc+":"+doc.get("ArticleID"));  
        } 
        Date end=new Date();
        System.out.println("耗时："+(end.getTime()-start.getTime())+"ms");
    }

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
speedyao 2018-05-10 08:35
关注
检索分页本来就很慢,你没觉得百度只有前几页的数据有效，后几页的数据基本就没用或者和前几页很一样

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(2条)

报告相同问题？

关注问题

Lucene4.X实战类baidu搜索的大型文档海量搜索系统-16.Lucene高级进阶2 共4页.pptx
2023-11-25 17:49

课程中还提供了多个实战项目，包括创建索引（CreateIndexFile.java）、删除索引（DelDocIndexFile.java）、更新索引（UpdateDocIndexFile.java）和搜索索引（SearchIndexFile.java）的Java代码示例，以及实现分页...
Lucene
2019-11-01 17:15

我咋这么优秀呢的博客 Lucene提供了一个简单却强大的应用程序接口，能够做全文索引和搜索，在java开发环境里Lucene是一个成熟的免费开放源代码工具；就其本身而论，Lucene是最近几年最受欢迎的java信息检索程序库 but，Lucene不提供爬....
ES在十几亿的数量级下如何提升查询效率？
2020-08-11 18:09

小晨说数据的博客二、ES搜索数据过程 es 最强大的是做全文检索，就是比如你有三条数据 java真好玩儿啊java好难学啊j2ee特别牛你根据 java 关键词来搜索，将包含 java的 document 给搜索出来。es 就会给你返回：java真好玩儿啊，...
Apache Lucene 7.7.2：全文搜索引擎库的稳定与创新
2025-08-19 19:43

格拉摩根终身伯爵的博客作为这一领域的佼佼者，Lucene以其出色的性能和灵活的架构，被广泛应用于各种需要高效搜索能力的场景。在本章节中，我们将概述Lucene7.7.2稳定版本的核心能力，以便读者对这个强大的搜索引擎有一个初步的了解。...
Lucene基础教程
2017-11-26 21:48

zhawabcd的博客 Lucene基础教程 1、什么是“全文检索”（Full-Text Search） ①全文检索的概念全文检索首先将要查询的目标文档中的词提取出来，组成索引，通过查询索引达到搜索目标文档的目的。这种先建立索引，再...
Lucene教程详解
2013-08-07 09:48

开源技术之家的博客 Lucene-3.0.0配置 ...一、Lucene开发环境配置 ...step1.Lucene开发包下载 ...step2.Java开发环境配置 ...step4.Lucene开发环境配置 ...解压下载的lucene-3.0.0.zip，可以看到lucene-core-3.0.0.jar和lu
Lucene教程
2017-02-25 17:28

咫_尺_天_涯的博客 1、什么是“全文检索”（Full-Text Search）①全文检索的概念全文检索首先将要查询的目标文档中的词提取出来，组成索引，通过查询索引达到搜索目标文档的目的。这种先建立索引，再对索引进行搜索的过程就叫全文检索...
lucene实现企业产品检索
2010-06-08 08:57

在Lucene中集成庖丁解牛，可以显著提高对中文关键词的识别和检索效率，从而提供更精确的搜索结果。 **2. Lucene的索引创建** 在实现企业产品检索时，我们需要先将产品信息转换为Lucene可处理的索引格式。这包括...
lucene4.4使用手册.docx
2021-08-27 08:20

而Lucene通过预建索引的方式，提高了搜索效率，类似于查字典先查目录再翻页，而不是逐页查找。 3. **使用场景** Lucene 主要应用于系统内部的资源搜索，如论坛、博客、电商网站的商品搜索等。虽然大型互联网搜索...
java毕业设计——基于JSP+JavaTM的搜索引擎设计与实现（毕业论文+程序源码）——搜索引擎
2023-04-15 20:17

毕业设计方案专家的博客网络中的资源非常丰富，但是如何有效的搜索信息却是一件困难的事情。建立搜索引擎就是解决这个问题的最好方法。本文首先详细介绍了基于英特网的搜索引擎的系统结构，然后从网络机器人、索引引擎、Web服务器三个方面...
没有解决我的问题, 去提问

java lucene的搜索和翻页效率？

3条回答 默认 最新

3条回答默认最新