caizhongda 2009-08-22 09:22
浏览 238
已采纳

关于Lucene分词,我想过做一个小的Lucene分词...结合paoding分词

[size=small][color=blue]关于Lucene分词,我想过做一个小的Lucene分词.
我用的是paoding分词..
我想在加一个算法每遇到大写字母时分词.例如 XpressMusic 要分词为成 xpress 和music[/color][/size]
[b]问题补充:[/b]
[quote]算出大写字母的区间,当读到部分的时候,对其进行判断,然后其余的就跟基于空格的分词一样了,不是吗
hupy (初级程序员) 2009-08-31
[/quote]

怎样在compass结合自己实现的这个算法呢..

可以说详细点吗.谢谢哈

  • 写回答

3条回答 默认 最新

  • hupy2007 2009-09-03 21:58
    关注

    compass仅仅是是一个框架,跟lucene是没有关系的,如果想是想上面的算法,要修改lucene的源代码,自己写一个filter类,在过滤的时候碰到大写字母分词就是了,这个需要稍微了解一下lucene的源代码了!!!!

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(2条)

报告相同问题?

悬赏问题

  • ¥15 手机连接电脑热点显示无ip分配
  • ¥15 delta降尺度计算的一些细节,有偿
  • ¥15 Arduino红外遥控代码有问题
  • ¥15 数值计算离散正交多项式
  • ¥30 数值计算均差系数编程
  • ¥15 redis-full-check比较 两个集群的数据出错
  • ¥15 Matlab编程问题
  • ¥15 训练的多模态特征融合模型准确度很低怎么办
  • ¥15 kylin启动报错log4j类冲突
  • ¥15 超声波模块测距控制点灯,灯的闪烁很不稳定,经过调试发现测的距离偏大