传奇在我这里流浪 2019-05-31 17:36 采纳率: 0%
浏览 247

请问为什么我的代码实现不了功能,还报错了呢?

import jieba
import pandas as pd
from scipy.misc import imread
import matplotlib.pyplot as plt
import numpy as np
from wordcloud import WordCloud,ImageColorGenerator
file = open("E:/箴言资料.txt", mode='r', encoding='utf-8',newline=None)
content = file.read()
file.close()
jieba.load_userdict('E:/箴言词库.txt')
segments = []
segs = jieba.cut(content)
for seg in segs:
if len(seg) > 1:
segments.append(seg)
segmentDF = pd.DataFrame(segments)
segmentDF.columns=['segment']
stopwords = pd.read_csv(
"D:/StopwordsCN1.txt",
encoding='utf8',
index_col=False,
quoting=3,
sep="\t"
)
segmentDF = segmentDF[~segmentDF.segment.isin(stopwords.stopword)]
wyStopWords = pd.Series([
'之', '其', '或', '亦', '方', '于', '即', '皆', '因', '仍', '故',
'尚', '呢', '了', '的', '着', '一', '不', '乃', '呀', '吗', '咧',
'啊', '把', '让', '向', '往', '是', '在', '越', '再', '更', '比',
'很', '偏', '别', '好', '可', '便', '就', '但', '儿', # 高频副词
'又', '也', '都', '要',
'这', '那', '你', '我', '他',
'来', '去', '道', '笑', '说',
])
segmentDF = segmentDF[~segmentDF.segment.isin(wyStopWords)]
segdict = {col: segmentDF[col].tolist() for col in segmentDF.columns}

segcount = segmentDF.groupby(by='segment')['segment'].agg({
'频数':np.size}).reset_index().sort_index(by=['频数'],ascending=False)

words = segcount.set_index('segment').to_dict()
wc=WordCloud(
r'D:/simhei.ttf',width=500, height=400,
background_color='white',font_step=3,
mask=imread("E:/书本.jpg"),
random_state=False, prefer_horizontal=0.9
)
wc.fit_words(words['频数'])
plt.figure()
plt.imshow(wc)
plt.axis('off')
plt.show()
wc.to_file('E:/result.jpg')

  • 写回答

0条回答 默认 最新

    报告相同问题?

    悬赏问题

    • ¥20 我想使用一些网络协议或者部分协议也行,主要想实现类似于traceroute的一定步长内的路由拓扑功能
    • ¥30 深度学习,前后端连接
    • ¥15 孟德尔随机化结果不一致
    • ¥15 apm2.8飞控罗盘bad health,加速度计校准失败
    • ¥15 求解O-S方程的特征值问题给出边界层布拉休斯平行流的中性曲线
    • ¥15 谁有desed数据集呀
    • ¥20 手写数字识别运行c仿真时,程序报错错误代码sim211-100
    • ¥15 关于#hadoop#的问题
    • ¥15 (标签-Python|关键词-socket)
    • ¥15 keil里为什么main.c定义的函数在it.c调用不了