LS_SL 2019-07-19 09:49 采纳率: 100%
浏览 468
已采纳

在一个文件列表,搜索文档内容如何保证效率

一个文件列表有N份文档,每份文档有N多内容。
现在输入一个关键字,搜索文档内容,然后列出匹配的文档,这样的搜索效率能保证吗?

  • 写回答

3条回答 默认 最新

  • threenewbee 2019-07-19 10:00
    关注

    一般来说要做全文索引(倒排索引),原理是,首先遍历所有待搜索的文件,将里面的单词(中文需要先分词)提取出来,构成一个 单词->哪些文件包含这个单词
    的一个索引表。当你要搜索关键字的时候,不需要再度区所有文件,只要在这个索引中找关键字对应哪些文件有就可以了。
    这也是现在搜索引擎的基本的原理。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(2条)

报告相同问题?

悬赏问题

  • ¥15 2024-五一综合模拟赛
  • ¥15 下图接收小电路,谁知道原理
  • ¥15 装 pytorch 的时候出了好多问题,遇到这种情况怎么处理?
  • ¥20 IOS游览器某宝手机网页版自动立即购买JavaScript脚本
  • ¥15 手机接入宽带网线,如何释放宽带全部速度
  • ¥30 关于#r语言#的问题:如何对R语言中mfgarch包中构建的garch-midas模型进行样本内长期波动率预测和样本外长期波动率预测
  • ¥15 ETLCloud 处理json多层级问题
  • ¥15 matlab中使用gurobi时报错
  • ¥15 这个主板怎么能扩出一两个sata口
  • ¥15 不是,这到底错哪儿了😭