如何建立索引,加快文本检索

怎样利用某种数据结构,然后建立起某种索引,加快文本检索速度,如果有类似于word的查找算法实现最好不过了,求大神指教,谢了

2个回答

word的查找算法效率并不高,它就是顺序查找。要想做文本检索,可以使用倒排索引。对于中文来说,首先需要分词。
倒排索引的原理就是将文本中的单词提取出来,建立单词->对应文章位置的映射关系,这样直接通过关键字就能找到文本了。
具体实现google:倒排索引 全文检索

Csdn user default icon
上传中...
上传图片
插入图片
抄袭、复制答案,以达到刷声望分或其他目的的行为,在CSDN问答是严格禁止的,一经发现立刻封号。是时候展现真正的技术了!