caizhongda 2009-08-22 09:22
浏览 238
已采纳

关于Lucene分词,我想过做一个小的Lucene分词...结合paoding分词

[size=small][color=blue]关于Lucene分词,我想过做一个小的Lucene分词.
我用的是paoding分词..
我想在加一个算法每遇到大写字母时分词.例如 XpressMusic 要分词为成 xpress 和music[/color][/size]
[b]问题补充:[/b]
[quote]算出大写字母的区间,当读到部分的时候,对其进行判断,然后其余的就跟基于空格的分词一样了,不是吗
hupy (初级程序员) 2009-08-31
[/quote]

怎样在compass结合自己实现的这个算法呢..

可以说详细点吗.谢谢哈

  • 写回答

3条回答 默认 最新

  • hupy2007 2009-09-03 21:58
    关注

    compass仅仅是是一个框架,跟lucene是没有关系的,如果想是想上面的算法,要修改lucene的源代码,自己写一个filter类,在过滤的时候碰到大写字母分词就是了,这个需要稍微了解一下lucene的源代码了!!!!

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(2条)

报告相同问题?

悬赏问题

  • ¥30 vb net 使用 sendMessage 如何输入鼠标坐标
  • ¥200 求能开发抖音自动回复卡片的软件
  • ¥15 关于freesurfer使用freeview可视化的问题
  • ¥100 谁能在荣耀自带系统MagicOS版本下,隐藏手机桌面图标?
  • ¥15 求SC-LIWC词典!
  • ¥20 有关esp8266连接阿里云
  • ¥15 C# 调用Bartender打印机打印
  • ¥15 我这个代码哪里有问题 acm 平台上显示错误 90%,我自己运行好像没什么问题
  • ¥50 C#编程中使用printDocument类实现文字排版打印问题
  • ¥15 找会编程的帅哥美女 可以用MATLAB里面的simulink编程,用Keil5编也可以。