python hanlp分词，部分自定义词典不起作用？

在使用python版 hanlp进行分词，有自定义词典“亚胺培南、西司他丁”。对文本“亚胺培南西司他丁”进行分词时，为什么会分出“[亚胺/gb, 培/v, 南西/nrf, 司/ng, 他/rr, 丁/ng]”，如何强制使用自定义词典，期望分词为“[亚胺培南/kw,西司他丁/kw]”

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
Looooking 2019-04-18 17:08
关注
如果用jieba分词的话，应该可以自定义词频，提高自定义词的优先级
jieba.add_word('亚胺培南', freq=20000)
jieba.add_word('西司他丁', freq=20000)
list(jieba.cut('亚胺培南西司他丁'))

解决
无用 1
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

spyder中python的缓存机制怎么不起作用？ python
2019-09-22 20:38

回答 2 已采纳因为在同一个函数里, python编译器会优化相同的字面常量(literals), 所以虽然值是-100,但是指向的是同样的常量地址。如果是不同的函数，就会为False. 如果你用交互式`>
python 无法识别自定义函数？ python 有问必答
2022-02-28 14:56

回答 3 已采纳把menu函数放在main函数的上面。
Python怎么检查自定义函数的参数输入是列表？ pycharm python
2022-04-26 00:08

回答 1 已采纳可以用isinstance函数检查数据类型 >>>a=[1,2,3,4.1] >>>isinstance(a,list) True >>>isin
HanLP分词+用户自定义词典
2020-01-14 13:40

机智翔学长的博客文章目录1....pynlpir中文分词+加载用户自定义词典我比较喜欢用HanLP，它的粒度刚刚好。 pynlpir太细了，词全切开了。 1. 分词重要性分错了可不好搞。资料： demo_custom_dictionary.py - github...
VScode中Python代码不高亮显示？？ python vscode 有问必答
2022-04-10 22:05

回答 2 已采纳安装这两个插件然后设置颜色主题或者你也可以安装其它你喜欢的然后颜色主题插件
用Python3.9不兼容Python3.8或者3.7吗？ python
2021-10-18 12:25

回答 2 已采纳最新版的Python3.9程序在 win7 上运行是有些问题。不过图中的这个错误明显是没有找到驱动呀，找找你的 IE 驱动到底在哪。另外删除线是提示某个函数即将被弃用，这个与Python版本其实没什
Python中如何定义一个变量但不赋值？ python
2022-02-07 20:39

回答 3 已采纳这个其实没必要，python好在方便，其他语言的数据类型比如你学int类型它一般占4个字节，你能int x；就算你不赋值你也能printf或者cout打印出它来，是一些开辟过的或者没用的等乱七八糟的空
jieba青春有你2自定义python分词词典
2020-04-28 22:53

jieba青春有你2自定义分词词典，青春有你2评论爬取，青春有你2视频饭圈自定义分词词典，jieba分词Python分词词典
Python，cfg库安装不了，如何解决？ python
2022-05-01 23:04

回答 1 已采纳没有名叫cfg的第三方模块啊，你是要做什么功能？任何找不到的模块都是报这个错误。
Python有关制作英文学习词典问题。 python
2021-12-31 21:48

回答 4 已采纳可以参考下这个 #英文字典 def oppendict(): dir = 'mydict.txt' dicts = {} tf=open(dir,'r+')
VS2022 Python print 不了中文，如何解决？ python 后端
2022-01-13 23:08

回答 3 已采纳编码问题，VS默认编码是gbk，python编码是utf-8
【python,hanlp】pyhanlp分词如何加入自定义词典
2021-01-30 17:24

菜菜2022的博客 step1：首先找到pyhanlp的...envs文件夹下面存放的就是python编译器所有的虚拟环境列表，这里我使用的是dome虚拟环境，按照这种格式”虚拟环境->Lib->site-packages->pyhanlp->static->data->dicti
实现bigram分词系统的python代码 python 中文分词
2023-03-28 19:25

回答 1 已采纳实现bigram分词系统可以使用Python中的基础字符串处理函数和一些基本的数据结构。下面是一个简单的实现过程：定义一个词典：可以将一个包含大量单词的文本文件读入一个列表中，每个单词作为列表的一个
python分词自定义词典_pyhanlp用户自定义词典添加实例说明
2021-02-10 00:40

凯米拉诺的博客 pyhanlp用户自定义词典添加实例说明pyhanlp是python版封装的的HanLP，项目地址：https://github.com/hankcs/pyhanlp经过测试，HanLP比nltk在中文分词和实体识别方面都更好用. 如何向pyhanlp添加自定义的词典？以...
Python 实战 | 进阶中文分词之 HanLP 词典分词（上）
2023-10-30 11:01

企研数据的博客 HanLP 分词器，一个实用且高效的自然语言处理助手，不妨试一试。
没有解决我的问题, 去提问

悬赏问题

¥15 oracle集群安装出bug
¥15 关于#python#的问题：自动化测试
¥20 问题请教！vue项目关于Nginx配置nonce安全策略的问题
¥15 教务系统账号被盗号如何追溯设备
¥20 delta降尺度方法，未来数据怎么降尺度
¥15 c# 使用NPOI快速将datatable数据导入excel中指定sheet，要求快速高效
¥15 再不同版本的系统上，TCP传输速度不一致
¥15 高德地图点聚合中Marker的位置无法实时更新
¥15 DIFY API Endpoint 问题。
¥20 sub地址DHCP问题

python hanlp分词，部分自定义词典不起作用？

1条回答 默认 最新

悬赏问题

1条回答默认最新