项目中用了mongodb进行存储python爬取的相关数据。爬取的内容95%的都是中文的。现在有业务需要根据关键字从mongodb中进行全文检索。在开发过程中,发现中文检索在某些情况下检索不出来,特来论坛求猿神赐教。下面贴相关代码和图片:
mogodb相关业务某个集合里面的数据:
java查询代码如下:
集合中有5条包含“沙悟净”的数据,但是只查出来了前三条,后面两条查不出来,我翻过相关资料,都说全文检索对英文的支持是最好的,对中文支持不太好,英文的每个单词之间都是有空格或者标点符号的,而中文大部分汉字与汉字之间都是紧挨的,个别是有标点符号的。
如果我把最后两条的备注字段分别修改为:菩萨 沙悟净;佛祖 沙悟净 啊(或者是:佛祖,沙悟净。啊) 只要是关键词前后有分隔符。那么全文检索就能查询出来,如果没有分隔符则查不出来。 现在特来论坛求猿神赐教该怎么修改代码,能把后面2条查出来。
有猿神能赐教解决一下不,完美解决了 红包Ing!~