python利用jieba分词出现乱码问题，求指教

用一段新闻作分词，先用正则表达式去除标点符号re.sub(r,'',pos_news[0]),其中pos_news[0]是一段新闻。
print 之后是去除标点的一段新闻。
print " ".join(jieba.cut(re.sub(r,'',pos_news[0])))打出来乱码：
涵閬涓婁簡杩欎唤鐙壒鐨勭ょ墿濞绀句氬悇鐣鍟璧蜂簡搴鐑堢殑鍙

但是如果直接print " ".join(jieba.cut(pos_news[0])) 是正常的分词后的新闻
“ 我经常和孩子们说，要记住每一个帮助过我们的人，日后有能力了要记得报答人家！ ” 走访结束后，赵继（化名）母亲的话依然在 e 租宝志愿者的耳畔回绕。

不知道为什么我去除标点后分词就是乱码。。。NLP小白求指教！

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
oyljerry 2016-04-07 11:09
关注
先要看看你的编码是什么，你需要对应的解码，decode等。

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

Python的jieba库输出全部分词哪里出了问题 python
2022-06-02 11:36

回答 1 已采纳代码没错，只是你输出的内容错了可以参考 jieba.cut与jieba.lcut的区别_blackieliu的博客-CSDN博客_jieba.cut
python怎么把jieba分词后的结果导入excel中啊
2017-07-19 15:45

回答 1 已采纳 http://blog.csdn.net/u014070086/article/details/73201590
安装jieba库时出现了黄色乱码 python
2022-04-25 11:00

回答 1 已采纳换个源试试,输入 pip install jieba -i https://pypi.tuna.tsinghua.edu.cn/simple
python jieba分词教程_Python之jieba分词相关介绍
2021-03-17 01:37

w浩森的博客 1.jieba分词的安装直接在cmd窗口当中pip install即可2.jieba分词的介绍jieba分词是目前比较好的中文分词组件之一，jieba分词支持三种模式的分词(精确模式、全模式、搜索引擎模式)，并且支持自定义词典(这一点在特定...
python中jieba分词怎么把字母一个一个单独分开。 python 中文分词自然语言处理
2020-07-29 18:51

回答 1 已采纳 ``` import re sentence="hello你好" result=re.sub(r"([a-zA-Z])",r"\1 ", sentence) print(result.rs
请问使用jieba分词如何避免把我的时间词分开？ nlp python 自然语言处理
2022-04-29 20:27

回答 1 已采纳能不能用正则表达式先将这些筛出来，然后将其在语料中的删除，新的语料使用jieba分词，最后将两组词拼接
python实现中文分词，jieba库实现中文分词自然语言处理
2022-11-24 22:45

回答 1 已采纳这是详细的教程https://blog.csdn.net/weixin_44095417/article/details/121146386
python jieba分词并统计词频后输出结果到Excel和txt文档方法
2020-09-20 19:07

本篇文章主要介绍了python jieba分词并统计词频后输出结果到Excel和txt文档方法，具有一定的参考价值，感兴趣的小伙伴们可以参考一下
python中jieba库遇到的问题 python vscode 有问必答
2022-01-20 15:42

回答 2 已采纳看出来了，你不要用和库名一样的文件名把程序名改为 myjieba.py
python jieba库调用不成功 python
2022-08-11 20:23

回答 4 已采纳感谢各位，已经解决了，在隔壁帖子找到了解决方法https://blog.csdn.net/national_/article/details/121594916
jupyter nootbook中jieba分词出现NameError python
2021-08-17 11:41

回答 1 已采纳你是不是少import了一个库
python之jieba分词库使用
2023-06-25 09:53

陌北v1的博客本教程介绍了Python中jieba库的基本使用方法和常用功能，包括分词基础、自定义词典、关键词提取、词性标注、并行分词和Tokenize接口。通过学习和掌握这些功能，你可以在中文文本处理中灵活应用jieba库，实现有效的...
python中jieba.lcut切分词性标记的相关问题 python
2023-04-04 09:20

回答 10 已采纳该回答通过自己思路及引用到各个渠道搜索综合及思考,得到内容具体如下：出现错误的原因是在进行分词操作时，将分好的句子列表传入了jieba.posseg.lcut()函数中，这导致了错误的发生。因为ji
python同义词替换的实现（jieba分词）
2020-12-30 19:24

import jieba def replaceSynonymWords(string1): # 1读取同义词表，并生成一个字典。 combine_dict = {} # synonymWords.txt是同义词表，每行是一系列同义词，用空格分割 for line in open(TihuanWords.txt, r,...
python用jieba分词_Python调用jieba分词中的中文编码问题
2020-12-13 13:51

weixin_39921087的博客使用python调用jieba进行中文分词：https://github.com/fxsjy/jieba根据官方指导完成安装，copy demo，出现问题：# encoding=utf-8import jiebaseg_list = jieba.cut("我来到北京清华大学", cut_all=True)print(...
没有解决我的问题, 去提问

悬赏问题

¥15 关于#python#的问题：求帮写python代码
¥20 MATLAB画图图形出现上下震荡的线条
¥15 LiBeAs的带隙等于0.997eV,计算阴离子的N和P
¥15 关于#windows#的问题：怎么用WIN 11系统的电脑克隆WIN NT3.51-4.0系统的硬盘
¥15 来真人，不要ai！matlab有关常微分方程的问题求解决，
¥15 perl MISA分析p3_in脚本出错
¥15 k8s部署jupyterlab，jupyterlab保存不了文件
¥15 ubuntu虚拟机打包apk错误
¥199 rust编程架构设计的方案有偿
¥15 回答4f系统的像差计算

python利用jieba分词出现乱码问题，求指教

2条回答 默认 最新

悬赏问题

2条回答默认最新