python利用jieba分词出现乱码问题，求指教

用一段新闻作分词，先用正则表达式去除标点符号re.sub(r,'',pos_news[0]),其中pos_news[0]是一段新闻。
print 之后是去除标点的一段新闻。
print " ".join(jieba.cut(re.sub(r,'',pos_news[0])))打出来乱码：
涵閬涓婁簡杩欎唤鐙壒鐨勭ょ墿濞绀句氬悇鐣鍟璧蜂簡搴鐑堢殑鍙

但是如果直接print " ".join(jieba.cut(pos_news[0])) 是正常的分词后的新闻
“ 我经常和孩子们说，要记住每一个帮助过我们的人，日后有能力了要记得报答人家！ ” 走访结束后，赵继（化名）母亲的话依然在 e 租宝志愿者的耳畔回绕。

不知道为什么我去除标点后分词就是乱码。。。NLP小白求指教！

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
oyljerry 2016-04-07 11:09
关注
先要看看你的编码是什么，你需要对应的解码，decode等。

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

Python的jieba库输出全部分词哪里出了问题 python
2022-06-02 11:36

回答 1 已采纳代码没错，只是你输出的内容错了可以参考 jieba.cut与jieba.lcut的区别_blackieliu的博客-CSDN博客_jieba.cut
python怎么把jieba分词后的结果导入excel中啊
2017-07-19 15:45

回答 1 已采纳 http://blog.csdn.net/u014070086/article/details/73201590
安装jieba库时出现了黄色乱码 python
2022-04-25 11:00

回答 1 已采纳换个源试试,输入 pip install jieba -i https://pypi.tuna.tsinghua.edu.cn/simple
python jieba分词教程_Python之jieba分词相关介绍
2021-03-17 01:37

w浩森的博客 1.jieba分词的安装直接在cmd窗口当中pip install即可2.jieba分词的介绍jieba分词是目前比较好的中文分词组件之一，jieba分词支持三种模式的分词(精确模式、全模式、搜索引擎模式)，并且支持自定义词典(这一点在特定...
python中jieba分词怎么把字母一个一个单独分开。 python 中文分词自然语言处理
2020-07-29 18:51

回答 1 已采纳 ``` import re sentence="hello你好" result=re.sub(r"([a-zA-Z])",r"\1 ", sentence) print(result.rs
请问使用jieba分词如何避免把我的时间词分开？ nlp python 自然语言处理
2022-04-29 20:27

回答 1 已采纳能不能用正则表达式先将这些筛出来，然后将其在语料中的删除，新的语料使用jieba分词，最后将两组词拼接
python实现中文分词，jieba库实现中文分词自然语言处理
2022-11-24 22:45

回答 1 已采纳这是详细的教程https://blog.csdn.net/weixin_44095417/article/details/121146386
python jieba分词并统计词频后输出结果到Excel和txt文档方法
2020-09-20 19:07

本篇文章主要介绍了python jieba分词并统计词频后输出结果到Excel和txt文档方法，具有一定的参考价值，感兴趣的小伙伴们可以参考一下
python中jieba库遇到的问题 python vscode 有问必答
2022-01-20 15:42

回答 2 已采纳看出来了，你不要用和库名一样的文件名把程序名改为 myjieba.py
python jieba库调用不成功 python
2022-08-11 20:23

回答 4 已采纳感谢各位，已经解决了，在隔壁帖子找到了解决方法https://blog.csdn.net/national_/article/details/121594916
jupyter nootbook中jieba分词出现NameError python
2021-08-17 11:41

回答 1 已采纳你是不是少import了一个库
python之jieba分词库使用
2023-06-25 09:53

陌北v1的博客本教程介绍了Python中jieba库的基本使用方法和常用功能，包括分词基础、自定义词典、关键词提取、词性标注、并行分词和Tokenize接口。通过学习和掌握这些功能，你可以在中文文本处理中灵活应用jieba库，实现有效的...
python中jieba.lcut切分词性标记的相关问题 python
2023-04-04 09:20

回答 10 已采纳该回答通过自己思路及引用到各个渠道搜索综合及思考,得到内容具体如下：出现错误的原因是在进行分词操作时，将分好的句子列表传入了jieba.posseg.lcut()函数中，这导致了错误的发生。因为ji
python利用jieba实现中文分词
2021-11-04 16:59

DataAssassin的博客 jieba是一款强大的python第三方中文分词库。目前jieba已经支持四种分词模式：精确模式：试图将句子最精确地切开，不存在冗余数据，适合文本分析。全模式：把句子中所有的可以成词的词语都扫描出来, 速度非常快，...
python同义词替换的实现（jieba分词）
2020-12-30 19:24

import jieba def replaceSynonymWords(string1): # 1读取同义词表，并生成一个字典。 combine_dict = {} # synonymWords.txt是同义词表，每行是一系列同义词，用空格分割 for line in open(TihuanWords.txt, r,...
没有解决我的问题, 去提问

悬赏问题

¥20 delta降尺度方法，未来数据怎么降尺度
¥15 c# 使用NPOI快速将datatable数据导入excel中指定sheet，要求快速高效
¥15 再不同版本的系统上，TCP传输速度不一致
¥15 高德地图点聚合中Marker的位置无法实时更新
¥15 DIFY API Endpoint 问题。
¥20 sub地址DHCP问题
¥15 delta降尺度计算的一些细节，有偿
¥15 Arduino红外遥控代码有问题
¥15 数值计算离散正交多项式
¥30 数值计算均差系数编程