脸不大 2017-03-03 10:51 采纳率: 27.3%
浏览 7165

hanlp自定义字典不起作用

配置的地址没有报错,
root=D://
CustomDictionaryPath=data/dictionary/custom/CustomDictionary.txt;CompanyName.txt;school.txt;

字典(school.txt):
上海财经大学 ntu 1
上海交通大学 ntu 1
复旦大学 ntu 1
北京大学 ntu 1
清华大学 ntu 1
中国科学技术大学 ntu 1
浙江大学 ntu 1
中国人民大学 ntu 1
对外经济贸易大学 ntu 1
中央财经大学 ntu 1
同济大学 ntu 1
外交学院 ntu 1
上海外国语大学 ntu 1
北京外国语大学 ntu 1
北京航空航天大学 ntu 1
....
方法这样调用:
Segment segment = HanLP.newSegment().enableCustomDictionary(true);
final List schoolList = segment.seg(content);
但我定义的词和词性还是没有按照我设置的词进行分词,
例如我在自己的分词txt文件中设置了 浙江大学 ntu 1,
但分词后还是分成了 浙江 nt,大学 n,请大神指点一二

  • 写回答

5条回答

  • 东篱遁隐 2018-09-07 09:18
    关注

    原因很简单,你强制使用自定义词典代码写错,正确函数是:enableCustomDictionaryForcing(true);

    评论

报告相同问题?

悬赏问题

  • ¥15 我想在一个软件里添加一个优惠弹窗,应该怎么写代码
  • ¥15 fluent的在模拟压强时使用希望得到一些建议
  • ¥15 STM32驱动继电器
  • ¥15 Windows server update services
  • ¥15 关于#c语言#的问题:我现在在做一个墨水屏设计,2.9英寸的小屏怎么换4.2英寸大屏
  • ¥15 模糊pid与pid仿真结果几乎一样
  • ¥15 java的GUI的运用
  • ¥15 Web.config连不上数据库
  • ¥15 我想付费需要AKM公司DSP开发资料及相关开发。
  • ¥15 怎么配置广告联盟瀑布流