lucene4.0恢复索引问题 50C

由于在备份索引时候,索引文件更新导致索引文件损坏,经检查是下图中文件,由于数据量很大,不想重建索引库,在6月份有一个备份的索引文件,但是6月份的数据比现在少了很多,请问有什么方法可以把索引恢复呀??急!图片说明

6个回答

工具哦啊今天刚认为呕吐司法权威

第一步:进入索引管理

1、进入BIGLog控制面板,点击选择“索引管理”模块,在本示例中,我们选择打开biglog-access-2015.07.04数据索引:

biglog索引管理模块
第二步:打开指定的数据索引

2、找到需要启用的数据索引,通过点击,打开该索引即可:

打开biglog数据索引

3、选择打开指定索引后,系统会给出对话框进行确认:

打开biglog数据索引确认

注:恢复索引数据所需的过程将会根据索引文件的大小而定。
2 Comments

Reply
新用户233661 10 April 2017
那么买什么可以送女朋友呢?

Reply
新用户233661 10 April 2017
那么买什么可以送女朋友呢?
Leave a Reply

Your email address will not be published. Required fields are marked *

Comment

Name

Email

Website
Post Comment
数据维护管理
创建数据维护计划
恢复已关闭的索引
数据索引维护操作
使用指南

使用帮助
常见问题
商务合作

合作介绍
应用示

嫁汉嫁汉可立即离开

.......................

第一步:进入索引管理

1、进入BIGLog控制面板,点击选择“索引管理”模块,在本示例中,我们选择打开biglog-access-2015.07.04数据索引:

biglog索引管理模块
第二步:打开指定的数据索引

2、找到需要启用的数据索引,通过点击,打开该索引即可:

打开biglog数据索引

3、选择打开指定索引后,系统会给出对话框进行确认:

打开biglog数据索引确认

注:恢复索引数据所需的过程将会根据索引文件的大小而定。
2 Comments

Reply
新用户233661 10 April 2017
那么买什么可以送女朋友呢?

Reply
新用户233661 10 April 2017
那么买什么可以送女朋友呢?
Leave a Reply

Your email address will not be published. Required fields are marked *

Comment

Name

Email

Website
Post Comment
数据维护管理
创建数据维护计划
恢复已关闭的索引
数据索引维护操作
使用指南

使用帮助
常见问题
商务合作

合作介绍
应用示

1.按照小世界理论和算法,将文件分成6类。
2.对6类文件采用6个线程建立索引;
3.对6个索引文件进行一个关系关联;
经过上面3步,你的索引建立就会比较快了。需要注意的是6个索引文件尽量放置在不同硬盘空间上,这样提高磁盘读写速度。

Csdn user default icon
上传中...
上传图片
插入图片
抄袭、复制答案,以达到刷声望分或其他目的的行为,在CSDN问答是严格禁止的,一经发现立刻封号。是时候展现真正的技术了!
其他相关推荐
Lucene某条索引删除问题

我想问下 public static void deleteOneIndex(String indexDir, Analyzer analyzer, String field, String key) { try { Directory dir = new SimpleFSDirectory(new File(indexDir)); IndexWriter indexWriter = new IndexWriter(dir, analyzer, false, IndexWriter.MaxFieldLength.UNLIMITED); indexWriter.deleteDocuments(new Term(field, key)); indexWriter.optimize(); indexWriter.commit(); System.out.println("是否删除成功=" + indexWriter.hasDeletions()); System.out.println("一共有" + indexWriter.maxDoc() + "索引"); System.out.println("还剩" + indexWriter.numDocs() + "索引"); indexWriter.close(); } catch (IOException e) { System.out.println(" caught a " + e.getClass() + "\n with message: " + e.getMessage()); } } 这样为什么没有删除掉我想删除的索引 例如:deleteOneIndex("D:\\logs\\lucenedoc",new StandardAnalyzer(Version.LUCENE_33),"name","张三"); 没有分了 希望指点下,不胜感激!!

请问下lucene在重建索引的时候如何保证不影响当前搜索,谢谢

请问如何做到此业务场景,谢谢了

lucene更新索引,被更新索引的还在,还能被搜索到

使用lucene进行索引更新时,被更新的那条索引还存在;如果单独调用删除索引的方法的话,那条索引可以被删除 代码如下: [color=red]// 生成索引[/color] public boolean saveIndex(String id, String userId, String url, String title, String contents, String author, String date) { File indexFile = new File(indexDirPath); indexFile.mkdirs(); if(!indexFile.exists()) { try { indexFile.createNewFile(); } catch (IOException e) { e.printStackTrace(); return false; } } File[] files = new File(indexDirPath).listFiles(); boolean isCreate = true; //判断索引文件的建立是新建还是追加模式 if(files.length>0) { isCreate = false; } /*超链接,主要应用于附件的使用,比如附件下载 每个元素的都是附件路径和附件名以逗号隔开的字符串*/ String accessStr = this.getUrlStr(id.trim()); IndexWriter indexWriter = null; Directory directory = null; try { directory = new SimpleFSDirectory(indexFile); //索引配置 IndexWriterConfig indexWriterConfig=new IndexWriterConfig(Version.LUCENE_30, analyzer); //创建索引模式:CREATE,覆盖模式; APPEND,追加模式 if(isCreate) { indexWriterConfig.setOpenMode(IndexWriterConfig.OpenMode.CREATE); } else { indexWriterConfig.setOpenMode(IndexWriterConfig.OpenMode.APPEND); } // indexWriterConfig.setOpenMode(IndexWriterConfig.OpenMode.CREATE); //初始化索引创建器 indexWriter = new IndexWriter(directory,indexWriterConfig); Document doc = new Document(); // 创建Field对象,并放入doc对象中 doc.add(new Field("id", id.trim(), Field.Store.YES, Field.Index.NOT_ANALYZED)); doc.add(new Field("userId", userId, Field.Store.YES, Field.Index.NOT_ANALYZED)); doc.add(new Field("url", url, Field.Store.YES, Field.Index.ANALYZED)); doc.add(new Field("title", title, Field.Store.YES, Field.Index.ANALYZED)); doc.add(new Field("contents", contents, Field.Store.YES, Field.Index.ANALYZED)); doc.add(new Field("accesses", accessStr, Field.Store.YES, Field.Index.ANALYZED)); doc.add(new Field("author", author, Field.Store.YES, Field.Index.ANALYZED)); doc.add(new Field("date", date, Field.Store.YES, Field.Index.NOT_ANALYZED)); doc.add(new Field("indexDate", DateTools.dateToString(new Date(), DateTools.Resolution.DAY), Field.Store.YES, Field.Index.NOT_ANALYZED)); // 写入IndexWriter indexWriter.addDocument(doc); // 查看IndexWriter里面有多少个索引 // System.out.println("numDocs" + indexWriter.numDocs()); indexWriter.close(); } catch (IOException e) { e.printStackTrace(); return false; } return true; } [color=red]// 删除索引[/color] public boolean deleteIndex(String id) { /*File classDir = new File(this.getClass().getClassLoader().getResource("").getPath()); String proDir = classDir.getParentFile().getParentFile().getPath();*/ File indexFile = new File(indexDirPath); // File indexDir = new File("D:\\temp\\indexDir"); Directory directory; try { directory = new SimpleFSDirectory(indexFile); /*IndexReader ir = IndexReader.open(directory,false); //true:索引打开模式为只读(readOnly); // false:索引打开模式不为可读,即为可更改 Term term = new Term("id",id); ir.deleteDocuments(term); ir.close();*/ IndexWriterConfig indexWriterConfig=new IndexWriterConfig(Version.LUCENE_30, analyzer); IndexWriter iw = new IndexWriter(directory,indexWriterConfig); Term term = new Term("id",id); iw.deleteDocuments(term); iw.optimize(); iw.commit(); iw.close(); } catch (IOException e) { e.printStackTrace(); return false; } return true; } [color=red]// 更新索引的方法[/color] public boolean updateIndex(String id, String userId, String url, String title, String contents, String author, String date) { /*this.deleteIndex(id.trim()); if(this.deleteIndex(id.trim())) { this.saveIndex(id.trim(), userId, url, title, contents, author, date); }*/ File indexFile = new File(indexDirPath); // 超链接,主要应用于附件的使用,比如附件下载 每个元素的都是附件路径和附件名以逗号隔开的字符串 String accessStr = this.getUrlStr(id); Term term = new Term("id",id); IndexWriter indexWriter = null; Directory directory = null; try { directory = new SimpleFSDirectory(indexFile); //索引配置 // IndexWriterConfig indexWriterConfig=new IndexWriterConfig(Version.LUCENE_30, analyzer); //创建索引模式:CREATE,覆盖模式; APPEND,追加模式 // indexWriterConfig.setOpenMode(IndexWriterConfig.OpenMode.CREATE); //初始化索引创建器 indexWriter = new IndexWriter(directory, analyzer, false, IndexWriter.MaxFieldLength.UNLIMITED); indexWriter.setUseCompoundFile(true); Document doc = new Document(); // 创建Field对象,并放入doc对象中 doc.add(new Field("id", id, Field.Store.YES, Field.Index.NOT_ANALYZED)); doc.add(new Field("userId", userId, Field.Store.YES, Field.Index.NOT_ANALYZED)); doc.add(new Field("url", url, Field.Store.YES, Field.Index.ANALYZED)); doc.add(new Field("title", title, Field.Store.YES, Field.Index.ANALYZED)); doc.add(new Field("contents", contents, Field.Store.YES, Field.Index.ANALYZED)); doc.add(new Field("accesses", accessStr, Field.Store.YES, Field.Index.ANALYZED)); doc.add(new Field("author", author, Field.Store.YES, Field.Index.ANALYZED)); doc.add(new Field("date", date, Field.Store.YES, Field.Index.NOT_ANALYZED)); doc.add(new Field("indexDate", DateTools.dateToString(new Date(), DateTools.Resolution.DAY), Field.Store.YES, Field.Index.NOT_ANALYZED)); // 更新IndexWriter indexWriter.updateDocument(term, doc); // 查看IndexWriter里面有多少个索引 // System.out.println("numDocs" + indexWriter.numDocs()); indexWriter.commit(); indexWriter.close(); } catch (IOException e) { e.printStackTrace(); return false; } return true; }

WEB开发中Lucene创建索引时内存溢出

在查询数据库后创建索引过程中出现内存溢出,通过辅助软件查看,发现是很多的实体被占用没有被释放,导致堆内存溢出,是否有人遇到这种情况,如何解决? PS:增大JVM的堆内存,这种方式无效,因为实体越来越大,总会溢出。

Lucene.net 创建索引 txt文档

怎么用Lucene.net对已有的txt文本创建索引,索引文件__r.cfs,_r.cfx,segments.gen,segments_m是编代码之后自动生成的还是怎么来的?大致步骤是什么样的。

lucene怎样将文档中一部分内容建立索引?

因为有大量的文档需要建立索引(上万),而且我要查找的并不是整个文档的内容,只要文档中的一部分 索引[color=red]我想知道怎样将一个文档中的一部分建立索引[/color],lucene有没有这样的机制? 还是说需要我在建立索引之前先将文档中我要建立索引的部分先读出来放到另外一个文件中,在对这个文件进行索引呢? 望指点啊!!!

lucene怎样在做增量索引的同时更新旧数据?

现在的项目要求做近实时索引,大约15分钟更行一次。数据会不断新增,而旧数据也会经常被修改。我计划用增量索引来做,根据数据库的更新时间来添加文档。但被更新的文档可能索引里已经有了,添加之后数据可能会重复。 请问如何消除这种重复的可能性,是每添加一个document时都先查一下索引里是不是已经有,还是记录数据库所有的修改操作并将id放到队列里,跑索引的时候一起更新?请问lucene有没有更好的内部机制解决这个问题,比如能不能像数据库一样指定unique的字段?

lucene搜索的时候可以去掉重复的索引只取一条吗?

lucene有这个功能吗?判断重复的条件是什么?可以自己指定吗?

Lucene索引和检索中文文件的问题

lucene初学者,基础不好,碰到以下问题,恳请各位大侠指导,小女子感激不尽! 用的是IKAnalyzer2012_u6.jar和lucene-core-3.6.2.jar 是对本地的文件进行的索引和检索,做的web版的 1、能检索英文的,就是检索不了中文的 2、英文的检索出来的doc.get("contents")的值是空的,但是文件名和路径能读出来 (附件里有代码) [color=orange]IndexUtil1.java [/color] [code="java"]package com.lium.bean; import java.io.BufferedReader; import java.io.File; import java.io.FileNotFoundException; import java.io.FileReader; import java.io.IOException; import org.apache.lucene.analysis.Analyzer; import org.apache.lucene.document.Document; import org.apache.lucene.document.Field; import org.apache.lucene.index.CorruptIndexException; import org.apache.lucene.index.IndexWriter; import org.apache.lucene.index.IndexWriterConfig; import org.apache.lucene.store.Directory; import org.apache.lucene.store.FSDirectory; import org.apache.lucene.store.LockObtainFailedException; import org.apache.lucene.util.Version; import org.wltea.analyzer.lucene.IKAnalyzer; public class IndexUtil1 { private Directory directory; private String indexPath = "F:/Lucene/test/indexDir1.2"; private String dataPath = "F:/Lucene/test/dataDir1.2"; public IndexUtil1() { try { directory = FSDirectory.open(new File(indexPath)); } catch (IOException e) { // TODO Auto-generated catch block e.printStackTrace(); } } public String readFile(File f) { String s; StringBuffer text = new StringBuffer(); try { BufferedReader br = new BufferedReader(new FileReader(f)); while((s = br.readLine())!=null) { text.append(s); } return text.toString(); } catch (FileNotFoundException e) { // TODO Auto-generated catch block e.printStackTrace(); } catch (IOException e) { // TODO Auto-generated catch block e.printStackTrace(); } return null; } public void Index() { IndexWriter writer = null; try { Analyzer analyzer = new IKAnalyzer(); writer = new IndexWriter(directory, new IndexWriterConfig(Version.LUCENE_36, analyzer)); writer.deleteAll(); Document doc = null; File file = new File(dataPath); for (File f : file.listFiles()) { String text = readFile(f); doc = new Document(); doc.add(new Field("contents",text, Field.Store.YES,Field.Index.ANALYZED)); /*System.out.println(text);*/ /*text值没有问题,可以读出来*/ doc.add(new Field("filename", f.getName(), Field.Store.YES,Field.Index.NOT_ANALYZED)); doc.add(new Field("filepath", f.getCanonicalPath(),Field.Store.YES,Field.Index.NOT_ANALYZED)); writer.addDocument(doc); } } catch (CorruptIndexException e) { // TODO Auto-generated catch block e.printStackTrace(); } catch (LockObtainFailedException e) { // TODO Auto-generated catch block e.printStackTrace(); } catch (IOException e) { // TODO Auto-generated catch block e.printStackTrace(); } finally { if(writer != null) { try { writer.close(); } catch (CorruptIndexException e) { // TODO Auto-generated catch block e.printStackTrace(); } catch (IOException e) { // TODO Auto-generated catch block e.printStackTrace(); } } } } }[/code] [color=orange]SearcherUtil.java[/color] [code="java"]package com.lium.bean; import java.io.File; import java.io.IOException; import java.util.ArrayList; import java.util.List; import org.apache.lucene.document.Document; import org.apache.lucene.index.IndexReader; import org.apache.lucene.index.Term; import org.apache.lucene.search.IndexSearcher; import org.apache.lucene.search.Query; import org.apache.lucene.search.ScoreDoc; import org.apache.lucene.search.TermQuery; import org.apache.lucene.search.TopDocs; import org.apache.lucene.store.Directory; import org.apache.lucene.store.FSDirectory; public class SearcherUtil { private Directory directory; private IndexReader reader; public SearcherUtil() { try { directory = FSDirectory.open(new File("F:/Lucene/indexDir")); } catch (IOException e) { // TODO Auto-generated catch block e.printStackTrace(); } } public IndexSearcher getsearcher() { try { if(reader == null) { reader = IndexReader.open(directory); }else { IndexReader dr = IndexReader.openIfChanged(reader); if(dr != null) { reader = dr; } } return new IndexSearcher(reader); } /*catch (CorruptIndexException e) { // TODO Auto-generated catch block e.printStackTrace(); }*/ catch (IOException e) { // TODO Auto-generated catch block e.printStackTrace(); } return null; } public List<Results> seach(String keys) { try { IndexSearcher searcher = getsearcher(); Query query = new TermQuery(new Term("contents", keys)); TopDocs tds = searcher.search(query, 10); List<Results> rsList = new ArrayList<Results>(); for(ScoreDoc sd:tds.scoreDocs) { Document doc = searcher.doc(sd.doc); /*System.out.println(doc.get("contents"));*/ /*这里打印出来值是空的*/ Results rs = new Results(doc.get("filename"), doc.get("filepath"), doc.get("contents")); rsList.add(rs); } return rsList; } catch (IOException e) { // TODO Auto-generated catch block e.printStackTrace(); } return null; } } [/code] [color=orange]Results.java[/color] [code="java"]package com.lium.bean; public class Results { String filename; String filepath; String content; public Results(String filename, String filepath, String content) { super(); this.filename = filename; this.filepath = filepath; this.content = content; } public String getFilename() { return filename; } public void setFilename(String filename) { this.filename = filename; } public String getFilepath() { return filepath; } public void setFilepath(String filepath) { this.filepath = filepath; } public String getContent() { return content; } public void setContent(String content) { this.content = content; } }[/code] [color=orange]ISservlet.java[/color] [code="java"]package com.lium.servlet; import java.io.IOException; import java.util.List; import javax.servlet.ServletException; import javax.servlet.http.HttpServlet; import javax.servlet.http.HttpServletRequest; import javax.servlet.http.HttpServletResponse; import com.lium.bean.IndexUtil1; import com.lium.bean.Results; import com.lium.bean.SearcherUtil; public class ISservlet extends HttpServlet { private static final long serialVersionUID = 1L; /** * @see HttpServlet#doGet(HttpServletRequest request, HttpServletResponse response) */ protected void doGet(HttpServletRequest request, HttpServletResponse response) throws ServletException, IOException { this.doPost(request, response); } /** * @see HttpServlet#doPost(HttpServletRequest request, HttpServletResponse response) */ protected void doPost(HttpServletRequest request, HttpServletResponse response) throws ServletException, IOException { //System.out.println(request.getCharacterEncoding()); request.setCharacterEncoding("UTF-8"); String keys = request.getParameter("keywords"); IndexUtil1 iu = new IndexUtil1(); iu.Index(); SearcherUtil su = new SearcherUtil(); List<Results> rsList = su.seach(keys); if(rsList.size() > 0) { request.setAttribute("rsList", rsList); request.getRequestDispatcher("/SeacherResult.jsp").forward(request, response); } else { request.getRequestDispatcher("/fail.jsp").forward(request, response); } } }[/code] [color=orange]Seacher.html[/color] [code="java"]<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> <html> <head> <meta http-equiv="Content-Type" content="text/html; charset=UTF-8"> <link href="bootstrap/css/bootstrap.min.css" type="text/css" rel="stylesheet"/> <title>用户搜索界面</title> </head> <body> <div class="container-fluid"> <div class="row-fluid"> <div class="span2"> <!--Sidebar content--> </div> <div class="span10"> <h2>A Simple Searcher</h2> <form class="form-search" action="web/ISservlet" method="post"> <input type="text" class="input-medium search-query" name="keywords"> <button type="submit" class="btn">搜索</button> </form> </div> </div> </div> </body> </html>[/code] [color=orange]SeacherResult.jsp[/color] [code="java"]<%@page import="java.util.List"%> <%@ page language="java" contentType="text/html; charset=UTF-8" pageEncoding="UTF-8"%> <%@page import="com.lium.bean.*" %> <!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> <html> <head> <meta http-equiv="Content-Type" content="text/html; charset=UTF-8"> <title>搜索结果</title> </head> <body> <% List<Results> list=(List<Results>)request.getAttribute("rsList"); for(int i=0;i<list.size();i++) { Results rs = list.get(i); %> 文件名:<%=rs.getFilename()%><br> 文件内容:<%=rs.getContent()%><br> 文件路径:<%=rs.getFilepath()%><br> <% } %> </body> </html>[/code]

新手lucene求助,创建索引遇到问题,配置与报错信息如图所示,真心求解

![myecplise2016版,项目配置信息如图](https://img-ask.csdn.net/upload/201701/17/1484629218_51816.png) ![项目导入lucene包如图](https://img-ask.csdn.net/upload/201701/17/1484629248_610590.png) ![4个报错及报错信息如图](https://img-ask.csdn.net/upload/201701/17/1484629288_223798.png)

lucene对文件名、文件路径进行索引,搜索的时候不能检索出来

如题,lucene对文件名、文件路径都进行了索引,因为文件名、文件路径都包含特殊字符斜杠(/)和点(.),导致搜索的时候输入文件名或者路径,都无法搜索,使用/对字符进行转义也不行,请帮忙。 部分代码如下: protected Document getDocument(File f) throws IOException { Document doc = new Document(); doc.add(new Field("contents", new FileReader(f))); // System.out.println("=======f.getCanonicalPath()========"+f.getCanonicalPath()); // System.out.println("=======f.getName()========"+f.getName()); doc.add(new Field("fileName", f.getName(), Field.Store.YES,Field.Index.NOT_ANALYZED)); doc.add(new Field("fullpath",f.getCanonicalPath(),Field.Store.YES,Field.Index.NOT_ANALYZED)); return doc; } public void searchIndex(String key) throws CorruptIndexException, IOException, ParseException{ key = "C??work?output?张三?txt"; docDir = new File(indexDir); dir = FSDirectory.open(docDir); IndexSearcher indexSearcher = new IndexSearcher(dir); QueryParser parser = new QueryParser(Version.LUCENE_35, "fullpath", new StandardAnalyzer(Version.LUCENE_35)); Query query = parser.parse(key); TopDocs topDocs = indexSearcher.search(query, 10); System.out.println("====totalHits===="+topDocs.totalHits); for (ScoreDoc scoreDoc : topDocs.scoreDocs) { Document doc = indexSearcher.doc(scoreDoc.doc); System.out.println("====fullpath===="+doc.get("fullpath")); System.out.println("====fileName===="+doc.get("fileName")); } } 请给位大神帮忙,谢谢!

lucene建索引的几个问题

1.如何将几个路径下的索引合并到一个统一的路径下并且将原来的索引清除? 2.在搜索的时候term是完全匹配吗?比如我搜索“好”,这个term必须是“好”才能搜索吗? 3.现在搜索的时候要搜“铅笔”,我希望可以搜索与铅笔完全匹配的document,也要搜到与铅,和笔分别匹配的,但是“铅笔”的排在前面,这个用目前的什么分词器可以做到?排序如何实现? 4.对于同一个field里的内容,可以用不同的分词器分析两次吗?同样parsequery的时候可以parse多次吗?

Lucene如何获得索引列表及每个索引对应的记录条数(类似于google的自动提示)

需要做一个自动提示的搜索引擎,当输入一个关键字时就能查找到与输入相关的全部关键字,并能获取它们所对应的总记录数。请问Lucene能否实现这样的功能?

关于 Lucene3.3 特殊符号 (@#$%^&*) 无法索引问题

Lucene3.3 如题: 比如说 ,创建一个字符串“test_java”的索引,但是用_test来搜索,是搜不出 这条索引记录的。请问 ,如何在创建索引的时候, 把一些特殊符号 (@#$%^&*) 转化我想要的字符串,如空格等 ?听说是可以调 用分词器里面的方法过滤掉的。但是具体要怎么做?我看了很久的API,还是一头雾水。希望大家帮帮我。 测试代码: package test; import java.io.File; import java.io.IOException; import java.io.StringReader; import org.apache.lucene.analysis.Analyzer; import org.apache.lucene.analysis.KeywordAnalyzer; import org.apache.lucene.analysis.SimpleAnalyzer; import org.apache.lucene.analysis.Token; import org.apache.lucene.analysis.TokenStream; import org.apache.lucene.analysis.cjk.CJKAnalyzer; import org.apache.lucene.analysis.standard.StandardAnalyzer; import org.apache.lucene.analysis.tokenattributes.TermAttribute; import org.apache.lucene.document.Document; import org.apache.lucene.document.Field; import org.apache.lucene.document.Field.Index; import org.apache.lucene.document.Field.Store; import org.apache.lucene.index.IndexWriter; import org.apache.lucene.index.IndexWriterConfig; import org.apache.lucene.index.Term; import org.apache.lucene.search.IndexSearcher; import org.apache.lucene.search.Query; import org.apache.lucene.search.ScoreDoc; import org.apache.lucene.search.TermQuery; import org.apache.lucene.search.TopDocs; import org.apache.lucene.store.Directory; import org.apache.lucene.store.FSDirectory; import org.apache.lucene.util.Version; import org.junit.Test; public class Test { private static final Version MACTH_VERSION = Version.LUCENE_33; // version // number public void testCreate() throws IOException { Analyzer LUCENE_ANALUZER = new StandardAnalyzer(MACTH_VERSION); File indexDir = new File("D:\\index"); Directory dir = FSDirectory.open(indexDir); IndexWriterConfig iwc = new IndexWriterConfig(MACTH_VERSION, LUCENE_ANALUZER); // iwc.setOpenMode(IndexWriterConfig.OpenMode.CREATE); 创建索引时把历史索引删除 IndexWriter indexWriter = new IndexWriter(dir, iwc); Document document = new Document(); Field field = new Field("name", "java_Test", Store.YES, Index.ANALYZED); document.add(field); indexWriter.addDocument(document, LUCENE_ANALUZER); indexWriter.optimize(); indexWriter.close(); // close IndexWriter } public void testSearch() throws Exception { File indexDir = new File("D:\\index"); Directory dir = FSDirectory.open(indexDir); IndexSearcher indexSearcher = new IndexSearcher(dir); Term term = new Term("name", "_test"); Query query = new TermQuery(term); TopDocs topDocs = indexSearcher.search(query, Integer.MAX_VALUE); int totalResults = topDocs.totalHits; System.out.println(totalResults); for (int i = 0; i < totalResults; i++) { ScoreDoc scoreDoc = topDocs.scoreDocs[i]; int docSn = scoreDoc.doc; Document document = indexSearcher.doc(docSn); System.out.println(document.get("name")); } System.out.println(" ------------- "); indexSearcher.close(); } @Test public void testAnalyzer() throws Exception { String text = "test_java"; Analyzer analyzer = new StandardAnalyzer(Version.LUCENE_33); System.out.println("当前使用的分词器:" + analyzer.getClass()); TokenStream tokenStream = analyzer.tokenStream("content",new StringReader(text)); tokenStream.addAttribute(TermAttribute.class); while (tokenStream.incrementToken()) { TermAttribute termAttribute = tokenStream.getAttribute(TermAttribute.class); System.out.println(termAttribute.term()); } tokenStream.end(); tokenStream.close(); } }

lucene分词会不会增大索引文件

我知道lucene可以分词索引和不分词索引。我想知道是哪个占用的空间会比较大?非常感谢。目前测试的结果是不分词的结果会小一点。不知道真的是不是这样。

Lucene3.0.3配置 建立索引

进行Luence配置的过程中,到“Luence开发包中Demo调试”这步,“建立索引”,在DOS命令窗口中输入>java org.apache.lucene.demo.IndexFiles [D:\Java],回车,之后提示“文件名、目录名或卷标语法不正确。”问题出在哪里?输入Javac,有结果,应该不是环境变量设置的问题吧。求指点~

我问个lucene+IKAnalyzer的加载顺序问题

我服务启动之后是先创建的索引 然后再执行加载用户配置的扩展词典到主词库表里![图片说明](https://img-ask.csdn.net/upload/201601/21/1453364673_550782.png) 我有些不明白了,既然我都创建完索引了,这时候我的扩展分词应该是要没效果的, 可是结果就是扩展分词是有效的 我的扩展分词怎么就成为我的索引了

这样的需求是使用【lucene】还是使用 【数据库索引】

我有这样的一个需求: 一个数据库表格:(有很多个主要字段,其中内容固定,每个字段的长度都很短, 记录数10W+ 可能更多) 1.省份 | 2. 市 | 3. 街 | 4. 经度 | 5. 纬度 | ……………… 目标:1)可以实现:( 省市街 )三个条件的 单独 或者 组合 模糊查找如找 纬度:120~~130 以内 经度 80~~100以内 的记录 :如: 单查: “某某街” ( 符合要求的全部列出) 组合: "某" (市) "某" (街) 或者 "某" (省) "某" (街) ( 符合要求的全部列出) 2)经度和纬度是类似于 (123.48,46.54 )的双精度类型的数据 可以实现:通过给出一组 经纬度值,查出在其范围内的符合要求的记录 : 3)很短时间完成 以上需求都要把满足条件的 所有的字段 取出来,有可能以后要扩展! 您的回答1:需要这样的一些要求,是用Lucene好?还是数据库索引好?哪个速度快? 您的回答2:我们BOOS叫我用数据库索引,但是我不是DBA。才毕业,我用lucene做了个测试500W+的数据查找需要400毫秒左右!这样的速度是不是太慢了? 【2.5G的CPU,1G内存,XP】 您的回答3:我们BOOS昨天给我说,他的目标是:(10W+的模糊查找)【1毫秒】内出结果!我才毕业。觉得【1毫秒】太快了,真的可以吗?(我们用的是 mysql5 数据库) 请知道的前辈多说几句,我是一新人。在此先谢过了! 马上过年了,希望过个开心年啊!!谢谢大家了! [b]问题补充:[/b] 说老实话。。我也觉得1毫秒绝对不可能。可惜。。。 [b]问题补充:[/b] 问题是 用lucene快点还是 数据库索引快啊?? 今天又把我留下来学习。,。 叫我去弄。 我本来就是搞java的。喊我自己写 索引规则。。 我会个屁啊 [b]问题补充:[/b] 听说: 如果我想找上海酒店,价格在300~500之间。用Lucene处理,它会在内部形成类似这样的查询项: 地点:上海酒店 价格:300 地点:上海酒店 价格:301 ………… 地点:上海酒店 价格:500 总共要生成200个这样的查询项,这是倒排索引的机制所限定的。这还算好,如果客户来个100~10000,Lucene就直接挂掉了。 以上是在一个讨论中看到的。。 请问是吗? 如果在我的应用的经纬度的查询中,经纬度是 double的 我想办法把他转成int 在给lucene 索引,那样不是要生成 n万 个这样的查询项?

Lucene的Demo,查询不出来数据

今天初步学习了一下Lucene框架,写了一个Demo: 添加索引: ![图片说明](https://img-ask.csdn.net/upload/201707/03/1499059075_423686.png) 然后是搜索: ![图片说明](https://img-ask.csdn.net/upload/201707/03/1499061253_358878.png) 但是查询结果是0,不知道为什么,索引文件已经生成: ![图片说明](https://img-ask.csdn.net/upload/201707/03/1499059140_449499.png) 求大神解答,在线等...

大学四年自学走来,这些私藏的实用工具/学习网站我贡献出来了

大学四年,看课本是不可能一直看课本的了,对于学习,特别是自学,善于搜索网上的一些资源来辅助,还是非常有必要的,下面我就把这几年私藏的各种资源,网站贡献出来给你们。主要有:电子书搜索、实用工具、在线视频学习网站、非视频学习网站、软件下载、面试/求职必备网站。 注意:文中提到的所有资源,文末我都给你整理好了,你们只管拿去,如果觉得不错,转发、分享就是最大的支持了。 一、电子书搜索 对于大部分程序员...

在中国程序员是青春饭吗?

今年,我也32了 ,为了不给大家误导,咨询了猎头、圈内好友,以及年过35岁的几位老程序员……舍了老脸去揭人家伤疤……希望能给大家以帮助,记得帮我点赞哦。 目录: 你以为的人生 一次又一次的伤害 猎头界的真相 如何应对互联网行业的「中年危机」 一、你以为的人生 刚入行时,拿着傲人的工资,想着好好干,以为我们的人生是这样的: 等真到了那一天,你会发现,你的人生很可能是这样的: ...

程序员请照顾好自己,周末病魔差点一套带走我。

程序员在一个周末的时间,得了重病,差点当场去世,还好及时挽救回来了。

技术大佬:我去,你写的 switch 语句也太老土了吧

昨天早上通过远程的方式 review 了两名新来同事的代码,大部分代码都写得很漂亮,严谨的同时注释也很到位,这令我非常满意。但当我看到他们当中有一个人写的 switch 语句时,还是忍不住破口大骂:“我擦,小王,你丫写的 switch 语句也太老土了吧!” 来看看小王写的代码吧,看完不要骂我装逼啊。 private static String createPlayer(PlayerTypes p...

上班一个月,后悔当初着急入职的选择了

最近有个老铁,告诉我说,上班一个月,后悔当初着急入职现在公司了。他之前在美图做手机研发,今年美图那边今年也有一波组织优化调整,他是其中一个,在协商离职后,当时捉急找工作上班,因为有房贷供着,不能没有收入来源。所以匆忙选了一家公司,实际上是一个大型外包公司,主要派遣给其他手机厂商做外包项目。**当时承诺待遇还不错,所以就立马入职去上班了。但是后面入职后,发现薪酬待遇这块并不是HR所说那样,那个HR自...

女程序员,为什么比男程序员少???

昨天看到一档综艺节目,讨论了两个话题:(1)中国学生的数学成绩,平均下来看,会比国外好?为什么?(2)男生的数学成绩,平均下来看,会比女生好?为什么?同时,我又联想到了一个技术圈经常讨...

为什么本科以上学历的人只占中国人口的5%,但感觉遍地都是大学生?

中国大学生占总人口不到5% 2017年,中国整体的本科率仅有5.9%;如果算上研究生,这一比例可以进一步上升到6.5% 为什么在国家统计局推出的这份年鉴中,学历的最高一阶就是到研究生,而没有进一步再统计博士生的数量的。 原因其实并不难理解,相比全国和各省整体人口体量,博士生的占比非常之低,属于绝对意义上的小概率样本。 这一点,我们从上表中的各省研究生占比情况也可以看出端倪。除北京、天津、上海三...

副业收入是我做程序媛的3倍,工作外的B面人生是怎样的?

提到“程序员”,多数人脑海里首先想到的大约是:为人木讷、薪水超高、工作枯燥…… 然而,当离开工作岗位,撕去层层标签,脱下“程序员”这身外套,有的人生动又有趣,马上展现出了完全不同的A/B面人生! 不论是简单的爱好,还是正经的副业,他们都干得同样出色。偶尔,还能和程序员的特质结合,产生奇妙的“化学反应”。 @Charlotte:平日素颜示人,周末美妆博主 大家都以为程序媛也个个不修边幅,但我们也许...

MySQL数据库面试题(2020最新版)

文章目录数据库基础知识为什么要使用数据库什么是SQL?什么是MySQL?数据库三大范式是什么mysql有关权限的表都有哪几个MySQL的binlog有有几种录入格式?分别有什么区别?数据类型mysql有哪些数据类型引擎MySQL存储引擎MyISAM与InnoDB区别MyISAM索引与InnoDB索引的区别?InnoDB引擎的4大特性存储引擎选择索引什么是索引?索引有哪些优缺点?索引使用场景(重点)...

如果你是老板,你会不会踢了这样的员工?

有个好朋友ZS,是技术总监,昨天问我:“有一个老下属,跟了我很多年,做事勤勤恳恳,主动性也很好。但随着公司的发展,他的进步速度,跟不上团队的步伐了,有点...

我入职阿里后,才知道原来简历这么写

私下里,有不少读者问我:“二哥,如何才能写出一份专业的技术简历呢?我总感觉自己写的简历太烂了,所以投了无数份,都石沉大海了。”说实话,我自己好多年没有写过简历了,但我认识的一个同行,他在阿里,给我说了一些他当年写简历的方法论,我感觉太牛逼了,实在是忍不住,就分享了出来,希望能够帮助到你。 01、简历的本质 作为简历的撰写者,你必须要搞清楚一点,简历的本质是什么,它就是为了来销售你的价值主张的。往深...

程序员写出这样的代码,能不挨骂吗?

当你换槽填坑时,面对一个新的环境。能够快速熟练,上手实现业务需求是关键。但是,哪些因素会影响你快速上手呢?是原有代码写的不够好?还是注释写的不够好?昨夜...

外包程序员的幸福生活

今天给你们讲述一个外包程序员的幸福生活。男主是Z哥,不是在外包公司上班的那种,是一名自由职业者,接外包项目自己干。接下来讲的都是真人真事。 先给大家介绍一下男主,Z哥,老程序员,是我十多年前的老同事,技术大牛,当过CTO,也创过业。因为我俩都爱好喝酒、踢球,再加上住的距离不算远,所以一直也断断续续的联系着,我对Z哥的状况也有大概了解。 Z哥几年前创业失败,后来他开始干起了外包,利用自己的技术能...

带了6个月的徒弟当了面试官,而身为高级工程师的我天天修Bug......

即将毕业的应届毕业生一枚,现在只拿到了两家offer,但最近听到一些消息,其中一个offer,我这个组据说客户很少,很有可能整组被裁掉。 想问大家: 如果我刚入职这个组就被裁了怎么办呢? 大家都是什么时候知道自己要被裁了的? 面试软技能指导: BQ/Project/Resume 试听内容: 除了刷题,还有哪些技能是拿到offer不可或缺的要素 如何提升面试软实力:简历, 行为面试,沟通能...

优雅的替换if-else语句

场景 日常开发,if-else语句写的不少吧??当逻辑分支非常多的时候,if-else套了一层又一层,虽然业务功能倒是实现了,但是看起来是真的很不优雅,尤其是对于我这种有强迫症的程序"猿",看到这么多if-else,脑袋瓜子就嗡嗡的,总想着解锁新姿势:干掉过多的if-else!!!本文将介绍三板斧手段: 优先判断条件,条件不满足的,逻辑及时中断返回; 采用策略模式+工厂模式; 结合注解,锦...

离职半年了,老东家又发 offer,回不回?

有小伙伴问松哥这个问题,他在上海某公司,在离职了几个月后,前公司的领导联系到他,希望他能够返聘回去,他很纠结要不要回去? 俗话说好马不吃回头草,但是这个小伙伴既然感到纠结了,我觉得至少说明了两个问题:1.曾经的公司还不错;2.现在的日子也不是很如意。否则应该就不会纠结了。 老实说,松哥之前也有过类似的经历,今天就来和小伙伴们聊聊回头草到底吃不吃。 首先一个基本观点,就是离职了也没必要和老东家弄的苦...

记录下入职中软一个月(外包华为)

我在年前从上一家公司离职,没想到过年期间疫情爆发,我也被困在家里,在家呆着的日子让人很焦躁,于是我疯狂的投简历,看面试题,希望可以进大公司去看看。 我也有幸面试了我觉得还挺大的公司的(虽然不是bat之类的大厂,但是作为一名二本计算机专业刚毕业的大学生bat那些大厂我连投简历的勇气都没有),最后选择了中软,我知道这是一家外包公司,待遇各方面甚至不如我的上一家公司,但是对我而言这可是外包华为,能...

为什么程序员做外包会被瞧不起?

二哥,有个事想询问下您的意见,您觉得应届生值得去外包吗?公司虽然挺大的,中xx,但待遇感觉挺低,马上要报到,挺纠结的。

当HR压你价,说你只值7K,你该怎么回答?

当HR压你价,说你只值7K时,你可以流畅地回答,记住,是流畅,不能犹豫。 礼貌地说:“7K是吗?了解了。嗯~其实我对贵司的面试官印象很好。只不过,现在我的手头上已经有一份11K的offer。来面试,主要也是自己对贵司挺有兴趣的,所以过来看看……”(未完) 这段话主要是陪HR互诈的同时,从公司兴趣,公司职员印象上,都给予对方正面的肯定,既能提升HR的好感度,又能让谈判气氛融洽,为后面的发挥留足空间。...

面试:第十六章:Java中级开发

HashMap底层实现原理,红黑树,B+树,B树的结构原理 Spring的AOP和IOC是什么?它们常见的使用场景有哪些?Spring事务,事务的属性,传播行为,数据库隔离级别 Spring和SpringMVC,MyBatis以及SpringBoot的注解分别有哪些?SpringMVC的工作原理,SpringBoot框架的优点,MyBatis框架的优点 SpringCould组件有哪些,他们...

面试阿里p7,被按在地上摩擦,鬼知道我经历了什么?

面试阿里p7被问到的问题(当时我只知道第一个):@Conditional是做什么的?@Conditional多个条件是什么逻辑关系?条件判断在什么时候执...

Python爬虫,高清美图我全都要(彼岸桌面壁纸)

爬取彼岸桌面网站较为简单,用到了requests、lxml、Beautiful Soup4

无代码时代来临,程序员如何保住饭碗?

编程语言层出不穷,从最初的机器语言到如今2500种以上的高级语言,程序员们大呼“学到头秃”。程序员一边面临编程语言不断推陈出新,一边面临由于许多代码已存在,程序员编写新应用程序时存在重复“搬砖”的现象。 无代码/低代码编程应运而生。无代码/低代码是一种创建应用的方法,它可以让开发者使用最少的编码知识来快速开发应用程序。开发者通过图形界面中,可视化建模来组装和配置应用程序。这样一来,开发者直...

面试了一个 31 岁程序员,让我有所触动,30岁以上的程序员该何去何从?

最近面试了一个31岁8年经验的程序猿,让我有点感慨,大龄程序猿该何去何从。

6年开发经验女程序员,面试京东Java岗要求薪资28K

写在开头: 上周面试了一位女程序员,上午10::30来我们部门面试,2B哥接待了她.来看看她的简历: 个人简历 个人技能: ● 熟悉spring mvc 、spring、mybatis 等框架 ● 熟悉 redis 、rocketmq、dubbo、zookeeper、netty 、nginx、tomcat、mysql。 ● 阅读过juc 中的线程池、锁的源...

大三实习生,字节跳动面经分享,已拿Offer

说实话,自己的算法,我一个不会,太难了吧

程序员垃圾简历长什么样?

已经连续五年参加大厂校招、社招的技术面试工作,简历看的不下于万份 这篇文章会用实例告诉你,什么是差的程序员简历! 疫情快要结束了,各个公司也都开始春招了,作为即将红遍大江南北的新晋UP主,那当然要为小伙伴们做点事(手动狗头)。 就在公众号里公开征简历,义务帮大家看,并一一点评。《启舰:春招在即,义务帮大家看看简历吧》 一石激起千层浪,三天收到两百多封简历。 花光了两个星期的所有空闲时...

Java岗开发3年,公司临时抽查算法,离职后这几题我记一辈子

前几天我们公司做了一件蠢事,非常非常愚蠢的事情。我原以为从学校出来之后,除了找工作有测试外,不会有任何与考试有关的事儿。 但是,天有不测风云,公司技术总监、人事总监两位大佬突然降临到我们事业线,叫上我老大,给我们组织了一场别开生面的“考试”。 那是一个风和日丽的下午,我翘着二郎腿,左手端着一杯卡布奇诺,右手抓着我的罗技鼠标,滚动着轮轴,穿梭在头条热点之间。 “淡黄的长裙~蓬松的头发...

大牛都会用的IDEA调试技巧!!!

导读 前天面试了一个985高校的实习生,问了他平时用什么开发工具,他想也没想的说IDEA,于是我抛砖引玉的问了一下IDEA的调试用过吧,你说说怎么设置断点...

都前后端分离了,咱就别做页面跳转了!统统 JSON 交互

文章目录1. 无状态登录1.1 什么是有状态1.2 什么是无状态1.3 如何实现无状态1.4 各自优缺点2. 登录交互2.1 前后端分离的数据交互2.2 登录成功2.3 登录失败3. 未认证处理方案4. 注销登录 这是本系列的第四篇,有小伙伴找不到之前文章,松哥给大家列一个索引出来: 挖一个大坑,Spring Security 开搞! 松哥手把手带你入门 Spring Security,别再问密...

立即提问
相关内容推荐