zslllj 2015-04-11 13:07 采纳率: 0%
浏览 1934

请中文分词建立词典的问题

我是要实现一个基于Lucene的简易的垂直搜索引擎,都知道Lucene建立索引和检索的时候需要用到分词器,这个分词器很重要,目前我的思路是按照字符串匹配的方法基于词典分词,这个词典包含了该领域的一些专有名词,那么这个词典要如何得来呢?一个领域这么多专有名词,难道要手工输入吗?

  • 写回答

1条回答 默认 最新

  • devmiao 2015-04-11 15:09
    关注

    有通用的分词程序,但是专有名词这个需要找对应的词库。

    评论

报告相同问题?

悬赏问题

  • ¥15 c程序不知道为什么得不到结果
  • ¥40 复杂的限制性的商函数处理
  • ¥15 程序不包含适用于入口点的静态Main方法
  • ¥15 素材场景中光线烘焙后灯光失效
  • ¥15 请教一下各位,为什么我这个没有实现模拟点击
  • ¥15 执行 virtuoso 命令后,界面没有,cadence 启动不起来
  • ¥50 comfyui下连接animatediff节点生成视频质量非常差的原因
  • ¥20 有关区间dp的问题求解
  • ¥15 多电路系统共用电源的串扰问题
  • ¥15 slam rangenet++配置