如何对大文件分块建立索引? 80C

Elasticsearch + ik实现全文检索过程中,1、如何对大文件如pdf、doc等进行分块建立索引?2、当文件名含有中文时,如何获取文件路径(本地文件windows系统下)?

1个回答

一般是分词以后做倒排索引,中文文件名不妨,只要你的编码正确。

rmqc0909
rmqc0909 这个我知道的,就是对于大的pdf等文件,建立索引和检索速度都会很慢很慢,尤其是查询的时候,而且查询出来的结果显示不全,有问题,我今天对一个50m的pdf文件建立了索引,查询的时候restclient崩溃了都,中文名这个问题已经解决啦,
3 年多之前 回复
Csdn user default icon
上传中...
上传图片
插入图片
抄袭、复制答案,以达到刷声望分或其他目的的行为,在CSDN问答是严格禁止的,一经发现立刻封号。是时候展现真正的技术了!
立即提问
相关内容推荐