自然语言处理时，画词云图出现问题，之前运行成功过，今天运行报错

问题遇到的现象和发生背景

问题相关代码，请勿粘贴截图


```python
import os
import numpy as np
import pandas as pd
import re
import jieba.posseg as psg
import matplotlib.pyplot as plt
from gensim import corpora,models #主题挖掘，提取关键信息
from wordcloud import WordCloud,ImageColorGenerator
from collections import Counter
from sklearn.model_selection import train_test_split
from sklearn.feature_extraction.text import CountVectorizer
from sklearn.feature_extraction.text import TfidfTransformer
from sklearn.metrics import classification_report
from sklearn.metrics import accuracy_score

#导入数据
raw_data=pd.read_csv('D:\文本挖掘\期末作业\京东商品评论.csv',encoding='gbk')
print(raw_data.head())
# raw_data.info()
# print(raw_data.columns)
# 二、数据预处理
# （一）去重
# 删除系统自动为客户做出的评论。
reviews=raw_data.copy()
reviews=reviews[['content', 'content_type']]
print('去重之前：',reviews.shape[0])
reviews=reviews.drop_duplicates()
print('去重之后：',reviews.shape[0])
# 清洗之前
content=reviews['content']
for i in range(5,10):
    print(content[i])
    print('-----------')
#清洗之后，将数字、字母、京东欧莱雅紫熨斗眼霜字样都删除
info=re.compile('[0-9a-zA-Z]|京东|欧莱雅|紫熨斗眼霜|眼霜|')
content=content.apply(lambda x: info.sub('',str(x)))  #替换所有匹配项
print(content.head())

for i in range(5,10):
    print(content[i])
    print('-----------')

# （三）分词、词性标注、去除停用词、词云图
# (1)分词
#分词，由元组组成的list
seg_content=content.apply( lambda s:  [(x.word,x.flag) for x in psg.cut(s)] )
print(seg_content.shape)
# len(seg_content)
print(seg_content[5])
#统计评论词数
n_word=seg_content.apply(lambda s: len(s))

# len(n_word)
n_word.head(6)
#得到各分词在第几条评论
n_content=[ [x+1]*y for x,y in zip(list(seg_content.index),list(n_word))] #[x+1]*y,表示复制y份，由list组成的list
index_content_long=sum(n_content,[]) #表示去掉[]，拉平,返回list
# len(index_content_long)
sum([[2,2],[3,3,3]],[])
#分词及词性，去掉[]，拉平
seg_content.head()
seg_content_long=sum(seg_content,[])
print(seg_content_long)
type(seg_content_long)
len(seg_content_long)
print(seg_content_long[0])
#得到加长版的分词、词性
word_long=[x[0] for x in seg_content_long]
nature_long=[x[1] for x in seg_content_long]

len(word_long)
len(nature_long)
#content_type拉长
n_content_type=[ [x]*y for x,y in zip(list(reviews['content_type']),list(n_word))] #[x+1]*y,表示复制y份
content_type_long=sum(n_content_type,[]) #表示去掉[]，拉平

len(content_type_long)
review_long=pd.DataFrame({'index_content':index_content_long,
                        'word':word_long,
                        'nature':nature_long,
                        'content_type':content_type_long})
print(review_long.shape)
print(review_long.head())
#（2）去除标点符号、去除停用词
review_long['nature'].unique()
#去除标点符号
review_long_clean=review_long[review_long['nature']!='x'] #x表示标点符合
review_long_clean.shape
#导入停用词
stop_path=open('./data/stoplist.txt','r',encoding='UTF-8')
stop_words=stop_path.readlines()

# len(stop_words)
# stop_words[0:5]
#停用词，预处理
stop_words=[word.strip('\n') for word in stop_words]
# stop_words[0:5]
#得到不含停用词的分词表
word_long_clean=list(set(word_long)-set(stop_words))
len(word_long_clean)

review_long_clean=review_long_clean[review_long_clean['word'].isin(word_long_clean)]
print(review_long_clean.shape)
print('----------------------------------------')
# (3)在原df中，再增加一列，该分词在本条评论的位置
# 再次统计每条评论的分词数量
# n_word=review_long_clean.groupby('index_content').count()['word']
# # n_word
#
# index_word=[ list(np.arange(1,x+1)) for x in list(n_word)]
# index_word_long=sum(index_word,[]) #表示去掉[]，拉平
#
# # len(index_word_long)
# review_long_clean['index_word']=index_word_long
# review_long_clean.head()
# review_long_clean.to_csv('./1_review_long_clean.csv')
# n_review_long_clean=review_long_clean[[ 'n' in nat for nat in review_long_clean.nature]]
# n_review_long_clean.shape
# n_review_long_clean.head()
# n_review_long_clean.nature.value_counts()
# n_review_long_clean.to_csv('./1_n_review_long_clean.csv')
# import collections
# word_counts = collections.Counter(review_long_clean)
# word_counts_top10 = word_counts.most_common(10)
# print('********************',word_counts_top10)#词频统计
font=r"C:\Windows\Fonts\msyh.ttc"
from PIL import Image
background = Image.open('./jdicon.jpg')
graph = np.array(background)
wordcloud = WordCloud(font_path='C:/Windows/Fonts/msyh.ttc',
                      mask=graph,
                      background_color='white',
                      max_font_size=150,
                      random_state=30)
print('*******************',Counter(review_long_clean.word.values))
word_count = Counter(review_long_clean.word.values)
# print(type(word_count))
ciyuntu = wordcloud.fit_words(word_count)

# background_image=plt.imread('./jdicon.jpg')
# wordcloud = WordCloud(font_path=font, max_words = 100, background_color='white',mask=background_image) #width=1600,height=1200, mode='RGBA'
# wordcloud.generate_from_frequencies(Counter(review_long_clean.word.values))
# wordcloud.to_file('1_分词后的词云图.png')

plt.figure(figsize=(20,10))
plt.imshow(wordcloud)
plt.axis('off')
plt.show()

###### 运行结果及报错内容 

![img](https://img-mid.csdnimg.cn/release/static/image/mid/ask/763524804356163.png "#left")

###### 我的解答思路和尝试过的方法 
ciyuntu = wordcloud.fit_words(word_count)换成下面这句
wordcloud.generate_from_frequencies(Counter(review_long_clean.word.values))
###### 我想要达到的结果

![img](https://img-mid.csdnimg.cn/release/static/image/mid/ask/103874804356112.png "#left")

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

报告相同问题？

关注问题

NLP自然语言处理 01 文本预处理
2025-06-24 20:12

云渚钓月梦未杳的博客 6: '吴亦凡'} 1.4.3 word2vec模型 • 是一种将单词转换为词向量的自然语言处理技术 • 是利用深度学习网络来探索单词和单词之间的语义关系，用深度学习的网络权重参数表示词向量 • 是在无监督的语料 ...
【自然语言处理】中文文本字频统计与交互式可视化工具
2025-12-16 21:51

.笑对人生.的博客本文介绍了一个中文文本字频统计与交互式可视化工具的...可视化部分使用Plotly生成交互式图表，包括词云、热力图、关联网络等多种形式。工具具有易用性强、性能优异的特点，适用于中文文本分析、数据挖掘等应用场景。
（一）自然语言处理笔记——自然语言处理环节、RNN、LSTM、GRU部分
2025-10-14 16:49

郭庆汝的博客（一）自然语言处理笔记——自然语言处理环节、RNN、LSTM、GRU部分
自然语言之文本预处理
2022-06-02 00:21

WhereIsTom的博客感谢阅读文本处理的基本方法分词概念作用jieba安装结巴识别模式精确模式：全模式：搜索引擎模式：全模式和搜索引擎模式的区别：向切分依据的字典中添加、删除词语用户自定义词典（utf-8最佳）停用词文本处理的基本...
[Python从零到壹] 十六.文本挖掘之词云热点与LDA主题分布分析万字详解
2021-08-10 20:55

Eastmount的博客前一篇文章讲述了数据预处理、Jieba分词和文本聚类知识，这篇文章可以说是文本挖掘和自然语言处理的入门文章。本文将详细讲解文本挖掘领域的词云热点分析和LDA主题分布分析。两万字基础文章，希望对您有所帮助。欢迎...
WeNet语音识别分词制作词云图
2023-12-27 10:32

陈增林的博客本篇博客将介绍如何使用 Streamlit、jieba、wenet 和其他 Python 库，结合语音识别（WeNet）和词云生成，构建一个功能丰富的应用程序。我们将深入了解代码示例中的不同部分，并解释其如何实现音频处理、语音识别和...
Python 基础之词云（词的频率统计大小成图）的简单实现（包括图片词云，词云颜色，词的过滤）
2020-12-15 20:20

仙魁XAN的博客 Python是一种解释型脚本语言，可以应用于以下领域： Web 和 Internet开发、科学计算和统计、人工智能、教育、桌面界面开发、软件开发、后端开发、网络爬虫。本节简单介绍，词云的生成图、保存词云图片、图片 mask ...
NLP作业02：课程设计报告
2023-06-20 15:02

DDDDD954的博客自然语言课程（1）了解垃圾短信识别的背景知识，分析步骤和流程。（2）掌握 Jieba 分词、去停用词等文本预处理方法与应用。（3）掌握文本数据的向量表示方法。（4）掌握朴素贝叶斯分类算法的原理与应用。（1）...
自然语言处理期末复习
2025-06-11 13:38

Alvin_YD的博客 自然语言处理期末复习
Python3.8自然语言处理：云端NLTK环境新手友好教程
2026-01-17 04:15

SilverfoxOwl19的博客本文介绍了如何在星图GPU平台自动化部署Python3.8 + NLTK镜像，快速搭建云端自然语言处理环境。该镜像预装Jupyter、NLTK及常用数据科学库，特别适合语言学研究者进行文本分词、词性标注、情感分析等任务，实现零配置...
实习生靠AI秒变SQL大神：自然语言直接出复杂分析脚本，效率拉满
2025-12-19 16:04

飞算JavaAI开发助手的博客当开发者提出“把这个MySQL查询转换成Oracle版本”的需求时，SQL Chat会快速...它让SQL从一门需要死记硬背的“专业外语”，变成了能够用自然语言流畅交流的“母语”。剩下的工作，就交给这个专业的“数据库翻译官”。
2.文本预处理（分词，命名实体识别和词性标注，one-hot，word2vec，word embedding，文本数据分析，文本特征处理，文本数据增强）
2022-10-29 00:24

GCTTTTTT的博客（文本处理的基本方法（分词、命名实体识别和词性标注），文本张量表示方法（one-hot，word2vec，word embedding），文本数据分析，文本特征处理，文本数据增强）
自然语言处理实战——Transformer模型训练与可视化工具
2025-09-22 22:28

.笑对人生.的博客文章摘要本文介绍了轻量级Transformer模型在自然语言处理（NLP）中的应用，从RNN到Transformer的技术演进，以及如何通过四个步骤掌握Transformer模型：原理拆解、代码实现、训练全流程和可视化分析。文章详细列出了...
自然语言处理之中文分词（基于Python)
2018-11-07 11:15

pua.AI的博客人生苦短，我用python 除了给你生孩子，python都能给你做到。这句话所言不假，python拥有丰富的库，能完成各种各样的的功能。只有你想不到的，没有python做不到的。下面我们来看看python...在自然语言处理技术...
iThinkAir Code Interpreter 的原理解析
2024-07-30 15:15

3A Cloud的博客将图像转换为铅笔画使用词云统计高频词将图片转换为灰度图 "代码解释器"指令已经是一个成熟的AI指令，让用户真正可以用自然语言编程，只需要将意图用‘话’说出来，"代码解释器"就会自动生成Python代码帮你来实现...
【NLP论文】01 基于 Jieba 和 Word2vec 的关键词词库构建
2023-07-09 13:07

尹煜的博客举例以购物网站的在线评论作为语料库，对其进行分词等操作，最终构建关键词词库（以物流关键词词库为例）和顺便绘制词云图。关键词词库构建完成后，可以做的事情就多了，往后包括权值计算和情感分析，这些都是将...
实习生也能写复杂 SQL！飞算 JavaAI SQL Chat：自然语言秒变分析脚本
2025-12-08 17:58

飞算JavaAI开发助手的博客实习生小张盯着屏幕上的 SQL 报错提示愁眉不展：“WHERE 子句附近存在语法错误？” 旁边的老员工老李见状笑着支招：“不用死记语法，直接告诉飞算 JavaAI 你想查什么就行。周一晨会上，技术总监向小张提出需求：...
你也可以成为数据分析师: 实战案例手把手教你如何在ChatGPT内使用Code Interpreter进行数据分析
2023-07-15 22:02

恒TBOSH的博客 自然语言处理 接下来，我将探索Code Interpreter如何利用自然语言处理（NLP）来处理和分析数据，就像你要求的那样。NLP是一个激动人心的研究领域，专注于让计算机能够理解和处理人类语言。它仿照了我们人类之间的...
自然语言处理实战——基于k近邻法的文本分类
2025-11-08 18:10

.笑对人生.的博客系统包含完整的文本处理流程：数据加载与预处理、TF-IDF向量化、k值调优（k=5最优）、模型训练与评估。实验结果显示模型准确率达96.38%，并通过词云、混淆矩阵等可视化分析验证了分类效果。系统还支持相似文本检索...
自然语言处理实战——基于朴素贝叶斯法的文本情感分类
2025-10-13 00:15

.笑对人生.的博客本文介绍了朴素贝叶斯算法在文本情感分类中的应用，包括二分类（积极/消极）和多分类（积极/中性/消极）。主要内容包括：算法原理：基于... 可视化分析：生成类别分布图、高频词云、混淆矩阵等，辅助模型理解与评估。
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 6月2日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 5月25日

自然语言处理时，画词云图出现问题，之前运行成功过，今天运行报错

问题遇到的现象和发生背景

问题相关代码，请勿粘贴截图

0条回答 默认 最新

问题事件

0条回答默认最新