提问
jieba分词我想保留连续的”适得其反”这个词,
但是结果出来老是断成【适得 其反】,该怎么在下面的代码里写
3条回答 默认 最新
关注 - 你可以看下这个问题的回答https://ask.csdn.net/questions/7438759
- 我还给你找了一篇非常好的博客,你可以看看是否有帮助,链接:python jieba分词,图片打印清晰,设停用词,去英文
- 除此之外, 这篇博客: python中jieba分词使用基本介绍中的 结巴分词的三种模式 部分也许能够解决你的问题, 你可以仔细阅读以下内容或跳转源博客中阅读:
# encoding=utf-8 # 分词模式介绍 import jieba seg_list = jieba.cut("我来到北京清华大学", cut_all=True) print("Full Mode: " + "/ ".join(seg_list)) # 全模式 seg_list = jieba.cut("我来到北京清华大学", cut_all=False) print("Default Mode: " + "/ ".join(seg_list)) # 精确模式 seg_list = jieba.cut("他来到了网易杭研大厦") # 默认是精确模式 print(", ".join(seg_list)) seg_list = jieba.cut_for_search("小明硕士毕业于中国科学院计算所,后在日本京都大学深造") # 搜索引擎模式 print(", ".join(seg_list)) type(seg_list)
输出结果如下
- 您还可以看一下 钱兴会老师的从零开始自然语言处理课程中的 自己构建jieba分词的停词库,提升分词质量小节, 巩固相关知识点
解决 无用评论 打赏 举报
悬赏问题
- ¥15 WPF动态创建页面内容
- ¥15 如何对TBSS的结果进行统计学的分析已完成置换检验,如何在最终的TBSS输出结果提取除具体值及如何做进一步相关性分析
- ¥15 SQL数据库操作问题
- ¥100 关于lm339比较电路出现的问题
- ¥15 Matlab安装yalmip和cplex功能安装失败
- ¥15 加装宝马安卓中控改变开机画面
- ¥15 STK安装问题问问大家,这种情况应该怎么办
- ¥15 关于罗技鼠标宏lua文件的问题
- ¥15 halcon ocr mlp 识别问题
- ¥15 已知曲线满足正余弦函数,根据其峰值,还原出整条曲线