为什么中文生成的词云会有'这个符号

import re # 正则表达式库
import collections # 词频统计库
import numpy as np # numpy数据处理库
import jieba # 结巴分词
import wordcloud # 词云展示库
from PIL import Image # 图像处理库
import matplotlib.pyplot as plt # 图像展示库

读取文件

fn = open('sb.txt','r',encoding='utf-8') # 打开文件
string_data = fn.read() # 读出整个文件
fn.close() # 关闭文件

文本预处理

pattern = re.compile(u'\t|\n|.|-|:|;|)|(|?\、。u"') # 定义正则表达式匹配模式
string_data = re.sub(pattern, '', string_data) # 将符合模式的字符去除

文本分词

seg_list_exact = jieba.cut(string_data, cut_all = False) # 精确模式分词
object_list = []
remove_words = [u'、', u'，',u'。', u'是', u'对于', u'\u2002',u'等',u'能',u'都',u'。',u' ',u'、',u'中',u'在',u'了',
u'需要'] # 自定义去除词库

for word in seg_list_exact: # 循环读出每个分词
if word not in remove_words: # 如果不在去除词库中
object_list.append(word) # 分词追加到列表

词频统计

word_counts = collections.Counter(object_list) # 对分词做词频统计
word_counts_top20 = word_counts.most_common(20) # 获取前20最高频的词
print (word_counts_top20) # 输出检查
word_counts_top10 = str(word_counts_top20)

词频展示

mask = np.array(Image.open('地图2222.png')) # 定义词频背景
wc = wordcloud.WordCloud(
font_path='simfang.ttf', # 设置字体格式
mask=mask, # 设置背景图
max_words=300, # 最多显示词数
max_font_size=100, # 字体最大值
background_color='white',
width=1920, height=1080#设置宽和高

)
wc2 = wc.generate(word_counts_top10)
#wc.generate_from_frequencies(word_counts) # 从字典生成词云
plt.imshow(wc2) # 显示词云
plt.axis('off') # 关闭坐标轴
plt.savefig('G:\词云.jpg', dpi=600, bbox_inches='tight')
plt.show() # 显示图像
#wc.to_file('wor.png')

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
Love And Program 新星创作者: 人工智能技术领域 2022-06-09 18:55
关注
你看看那这个word_counts_top20 是“这种形式‘”，还是“这种形式”

解决无用
评论打赏
分享
举报编辑记录

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

python 程序生成词云图
2024-10-15 09:09

Python程序生成词云图是数据可视化领域的一个重要组成部分，它不仅丰富了数据展示的形式，还极大地增强了数据的传播力和影响力。随着Python语言和相关库的不断发展，相信词云图的生成将更加便捷高效，应用也将更加...
如何同时用python处理多个文本生成词云图，这篇文章就够了
2020-12-21 06:56

本文将详细介绍如何使用Python处理多个文本文件并生成词云图。关键知识点包括： 1. **编码声明**: `# -*- coding: utf-8 -*-` 是Python源代码的编码声明，确保程序能正确识别和处理中文字符。 2. **jieba分词库**:...
python词云图Python Web 爬虫，爬豆瓣影评，生成词云，再将词云生成图片.zip
2023-01-30 20:06

在这个项目中，我们主要探讨如何使用Python进行Web爬虫，抓取豆瓣电影评论，然后利用这些数据生成词云图，并最终将词云图保存为图片。以下是对整个过程的详细说明： 1. **Python Web爬虫**：Python是Web爬虫开发的...
python:从excel中提取高频词生成词云
2020-01-15 09:58

在Python编程语言中，处理Excel数据并生成词云是一项常见的任务，特别是在数据分析和自然语言处理领域。本篇文章将深入探讨如何使用Python从Excel文件中提取高频词汇并创建词云图。首先，我们需要导入必要的库。`...
python词云生成器，将txt文本自动分割生成词云图
2025-03-03 23:27

Python词云生成器是一种基于Python编程语言开发的软件工具，它能够读取纯文本（txt）格式的文件，并利用其中的文本内容自动分割生成词云图。词云图是一种将文本数据中的关键词以不同大小或颜色标识出来的视觉呈现...
Python-Flask写的在线词云生成工具
2019-08-10 09:21

在Flask应用中，开发者可以编写一个函数来读取用户上传的文本，使用`wordcloud`库生成词云，并将其保存为图像文件，然后返回该图像的URL供前端展示。此外，压缩包中的`flask-cy-master`可能包含以下文件和目录： 1...
通过jieba、wordcloud获取微信聊天记录，生成词云python代码
2025-09-29 16:26

wordcloud库是一个用于生成词云的Python库，通过它可以将文本数据可视化为云图形式。在生成词云的过程中，可以对词频进行统计，并根据词频的高低来调整在云图中的字体大小，使得出现频率高的词汇显示得更大，从而...
python制作词云图设置停用词,Python生成词云图
2021-04-27 03:27

衡水中屑official的博客获取目录地址，读取文本d = path.dirname(__file__)text = open(path.join(d, 'haha.txt')).read()# 生成一个词云图像wordcloud = ...
Python项目-实例-27 生成词云图.zip
2024-12-26 10:52

本项目实例将指导我们如何使用Python生成词云图，这不仅有助于理解Python在数据可视化方面的应用，而且能够提高我们对文本分析的认识。在进行项目之前，我们需要了解词云图的基本概念。词云图是一种将文本数据中...
python项目实例源码实例-27 生成词云图
2022-11-04 14:01

在Python编程领域，生成词云图是一项非常实用且有趣的技能，尤其在数据分析和可视化中广泛应用。词云图能够直观地展示文本数据中的关键词频率，帮助我们快速理解大量文本的主要内容。在这个实例-27中，我们将探讨...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 6月9日