脸不大 2017-03-03 02:51 采纳率: 0%
浏览 7174

hanlp自定义字典不起作用

配置的地址没有报错,
root=D://
CustomDictionaryPath=data/dictionary/custom/CustomDictionary.txt;CompanyName.txt;school.txt;

字典(school.txt):
上海财经大学 ntu 1
上海交通大学 ntu 1
复旦大学 ntu 1
北京大学 ntu 1
清华大学 ntu 1
中国科学技术大学 ntu 1
浙江大学 ntu 1
中国人民大学 ntu 1
对外经济贸易大学 ntu 1
中央财经大学 ntu 1
同济大学 ntu 1
外交学院 ntu 1
上海外国语大学 ntu 1
北京外国语大学 ntu 1
北京航空航天大学 ntu 1
....
方法这样调用:
Segment segment = HanLP.newSegment().enableCustomDictionary(true);
final List schoolList = segment.seg(content);
但我定义的词和词性还是没有按照我设置的词进行分词,
例如我在自己的分词txt文件中设置了 浙江大学 ntu 1,
但分词后还是分成了 浙江 nt,大学 n,请大神指点一二

  • 写回答

5条回答 默认 最新

  • 东篱遁隐 2018-09-07 01:18
    关注

    原因很简单,你强制使用自定义词典代码写错,正确函数是:enableCustomDictionaryForcing(true);

    评论
  • devmiao 2017-03-03 13:31
    关注
    评论
  • ai_niu 2017-04-04 19:38
    关注

    另外注意以下两点:
    1、保证自定义字典文件编码格式为utf-8;
    2、删除\data\dictionary\custom\CustomDictionary.txt.bin缓存文件;

    再次运行会提示找不到CustomDictionary.txt.bin文件,然后大概需要100s等待重新加载自定义词典即可!

    评论
  • 旭旭_哥 2017-04-27 07:08
    关注

    补充一点,自定义词中不能含有空格,否则一直会有警告。

    评论
  • 用Python写Java代码 2017-09-27 01:29
    关注

    问怎么添加都不起作用,为什么?
    我是Ubuntu 16.0

    评论
编辑
预览

报告相同问题?

悬赏问题

  • ¥15 宝塔面板一键迁移使用不了
  • ¥15 求一个按键录像存储到内存卡的ESP32CAM代码
  • ¥15 如何单独修改下列canvas推箱子代码target参数?,插入图片代替其形状,就是哪个绿色的圆圈每关用插入的图片替代
  • ¥20 四叉树的创建和输出问题
  • ¥15 javaweb连接数据库,jsp文件加载不出来
  • ¥15 matlab关于高斯赛德尔迭代的应用编撰。(相关搜索:matlab代码|迭代法)
  • ¥15 损失匹配问题,求解答
  • ¥15 3500常用汉字书法体检测数据集下载
  • ¥15 odoo17在制造模块或采购模块良品与次品如何分流和在质检模块下如何开发
  • ¥15 Qt音乐播放器的音乐文件相对路径怎么写
手机看
程序员都在用的中文IT技术交流社区

程序员都在用的中文IT技术交流社区

专业的中文 IT 技术社区,与千万技术人共成长

专业的中文 IT 技术社区,与千万技术人共成长

关注【CSDN】视频号,行业资讯、技术分享精彩不断,直播好礼送不停!

关注【CSDN】视频号,行业资讯、技术分享精彩不断,直播好礼送不停!

客服 返回
顶部