比如一个论坛的主题,,加答的内容有多个
例子:
spring是怎么?
回答一:spring是。。。。AA。。
回答二:spring是 BB
这样一来,你搜索回答spring时,就会出现多个”spring是怎么“的标题。。。。
Lucene里面提供了一个DuplicateFilter去重,,,不过这有个问题,,,他在去重时,只保留最后一条或最后一条,把其他的 忽略掉,,,如过滤最后一条时(回答二时),,,我搜“BB”就不会关联出标题。。。
。。。。。给个解决方案
比如一个论坛的主题,,加答的内容有多个
例子:
spring是怎么?
回答一:spring是。。。。AA。。
回答二:spring是 BB
这样一来,你搜索回答spring时,就会出现多个”spring是怎么“的标题。。。。
Lucene里面提供了一个DuplicateFilter去重,,,不过这有个问题,,,他在去重时,只保留最后一条或最后一条,把其他的 忽略掉,,,如过滤最后一条时(回答二时),,,我搜“BB”就不会关联出标题。。。
。。。。。给个解决方案
fiter不是用来过滤掉你不要的文档,而是你要的文档
而且DuplicatedFilter因为位置的关系,“碰巧”让你碰到了最后一个或者第一个文档。。(你可以试试加入第三个文档,中文唯一的文档你永远弄不出来)
DuplicatedFilter只能过滤duplicated的文档
要解决这个办法,自己写出一个query,来合并结果集合