【背景】
用户要求输入文章的完整标题也能将该文章完整检索下来,如“商海里穿梭的鱼:偷懒的6条原则”。
【我的想法】
在设计时多加一个字段用于对文章的标题不分词直接索引,这样就能实现用户要求的功能。但由于要结合Highlighter将用户输入的短语用标签对高亮显示,而Highlighter的getBestFragment()方法又必须要使用分词器或Token进行分词,这样把标题分词后就导致无法对整个文章标题加高亮了。
对于这个问题,虽然可以在做页面时给完整的文章标题可以手工添加高亮标签对,但这样会带来一些麻烦,如代码变得很不协调,更糟糕的是可能会出现这样的情况:用户选择以文章的完整标题作为输入,且标题是“暧昧”,而“暧昧”本身就是一个分词单元,这样就会产生暧昧的标签对嵌套(内层标签对是高亮器自动添加的,外层的则是在页面输出时手工添加的)。
请问对于这个问题,有什么比较好的解决方法呢?