如何向solr服务器提交大日志文件

现在公司有个项目对日志文件进行全文检索，准备用solr完成。现在遇到一个问题，由于日志的文件比较大，一般10几兆，大的已经达到几百兆了。我们将日志的内容设置为content字段，类型为string，但是当我们将documnet提交到server的时候，就报OOM的错误，请问如何解决该问题？

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

3条回答

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
wuhongze 2014-06-16 10:56
关注
[code="java"]public static void main(String[] args) {
try {
//Solr cell can also index MS file (2003 version and 2007 version) types.
String fileName = "c:/Sample.pdf";
//this will be unique Id used by Solr to index the file contents.
String solrId = "Sample.pdf";

indexFilesSolrCell(fileName, solrId); } catch (Exception ex) { System.out.println(ex.toString()); }

}

/**

Method to index all types of files into Solr.

@param fileName

@param solrId

@throws IOException

@throws SolrServerException
*/
public static void indexFilesSolrCell(String fileName, String solrId)
throws IOException, SolrServerException {

String urlString = "http://localhost:8983/solr";
SolrServer solr = new CommonsHttpSolrServer(urlString);

ContentStreamUpdateRequest up
= new ContentStreamUpdateRequest("/update/extract");

up.addFile(new File(fileName));

up.setParam("literal.id", solrId);
up.setParam("uprefix", "attr_");
up.setParam("fmap.content", "attr_content");

up.setAction(AbstractUpdateRequest.ACTION.COMMIT, true, true);

solr.request(up);

QueryResponse rsp = solr.query(new SolrQuery("*:*"));

System.out.println(rsp);
}[/code]
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(2条)

报告相同问题？

关注问题

solr-7.1.0.zip solr搜索引擎安装包
2018-05-26 23:31

2. `server`：包含了Solr服务器运行所需的所有组件，如Jetty web服务器、Solr配置文件、日志文件等。 3. `example`：包含了一个示例配置，展示了如何设置和运行Solr的基本步骤。 4. `dist`：包含Solr的jar文件和其他...
solr更新文件服务器,Solr的服务器的内存和磁盘空间
2021-08-04 11:36

小k小y小小m的博客首先，请访问your.solr.instance:[port]/[coreName]/admin/system并查看Solr实际使用的资源数量。 memory和system元素将对您最...对于磁盘空间，如果它是后面的日志文件，我不会感到惊讶。我还想知道，如果由于大...
solr服务器开启网页打不开,solr 服务器管理界面
2021-08-11 01:19

KateZeng的博客 solr 服务器管理界面可以查看系统状态、solr设置、分词检测、查询索引、增减core、查看日志等1.Dashboard(仪表盘)访问http://localhost:8080/solr时，出现该主页面，可查看到solr运行时间、solr版本，系统内存、...
java全文搜索服务器 solr_Apache Solr采用Java开发、基于Lucene的全文搜索服务器
2021-03-05 12:28

焦小叹的博客 http://docs.spring.io/spring-data/solr/首先介绍一下solr：Apache Solr (读音:SOLer)是一个开源、高性能、采用Java开发、基于Lucene的全文搜索服务器，文档通过Http利用XML加到一个搜索集合中，查询该集合也是通过...
solr搜索服务器 性能,搜索引擎选型-ElasticSearch、Solr 和Sphinx比较
2021-08-11 03:53

空然止于念的博客当前大约有20种搜索引擎可以选择，如果您正在寻找可靠而有效的方案，那么我建议您使用Elasticsearch，Solr或Sphinx，这三个都是开源搜索解决方案，得到了他们的贡献者社区的充分支持。它们都具有高性能，可扩展性和...
Solr：解锁高效搜索的神秘力量
2025-06-24 21:16

大雨淅淅的博客 Solr 作为一款强大的开源搜索工具，凭借其强大的搜索能力、丰富的功能特性和良好的扩展性，在电商、企业文档管理、新闻资讯等众多领域都有着广泛而出色的应用，为海量数据的高效检索提供了可靠的解决方案。...
linux solr日志,2018-04-22 Solr实现搜索功能单机版
2021-05-10 03:48

启明眼镜的博客 Linux 下安装Solrsolr安装版本是 4.10.3安装步骤1.解压缩tomcat tar zxvf 命令2.安装taomcat 在 usr/local 下创建一个目录solr， mkdir /usr/local/solr3.将解压缩好的tomcat pc 到/usr/local/solr ， cp -r apache-...
全文搜索引擎Solr原理和实战教程
2020-05-02 14:39

光子AI的博客客户使用请求来请求Solr执行查询或索引文件等操作。客户端应用程序可以通过创建HTTP请求和解析HTTP响应到达Solr。客户端API封装了发送请求和解析响应的大部分工作，这使得编写客户端应用程序变得更加容易。客户使用...
Solr 搭建搜索服务器
2017-05-13 10:32

日积月累@海纳百川的博客一、安装配置所需JDK和Tomcat和安装包solr-4.2.1.tgz Tomcat安装目录 /usr/local/tomcat 修改Tomcat支持中文 # vi /usr/local/tomcat/conf/server.xml ...# cp /root/solr-4.2.1/dist/solr-4.2.1.war
【Solr搜索引擎】-Solr知识点内容很详细
2026-02-19 16:30

Java后端的Ai之路的博客 Solr是一种基于Lucene的搜索引擎，主要区别包括架构、功能侧重和易用性。其核心机制包括倒排索引实现高效搜索、分片提升性能、Faceting分类统计等。Solr支持Schema和Schemaless两种模式，通过主从复制和SolrCloud...
没有解决我的问题, 去提问