出CSDN余额红包,有五级账号速度来,互利共赢一起发财,冲啊,速度
2条回答 默认 最新
关注 【相关推荐】
- 你可以参考下这个问题的回答, 看看是否对你有帮助, 链接: https://ask.csdn.net/questions/7399682
- 你也可以参考下这篇文章:如何爬取CSDN全站综合热榜标题,顺便统计关键词词频 | 爬虫案例
- 您还可以看一下 CSDN讲师老师的CSDN在线峰会系列—阿里云核心技术竞争力第二期课程中的 蔡俊杰:《云计算的终极秘密 - 智能的弹性》小节, 巩固相关知识点
- 除此之外, 这篇博客: 致CSDN读者的一些话:感恩这十年的陪伴,不负遇见,短暂消失中的 5.层次聚类主题树状图 部分也许能够解决你的问题, 你可以仔细阅读以下内容或跳转源博客中阅读:
层次聚类绘制的树状图,也是文本挖掘领域常用的技术,它会将各个领域相关的主题以树状的形式进行显示,这里输出结果如下图所示:
注意,这里作者可以通过设置过滤来显示树状图显示的主题词数量,并进行相关的对比实验,找到最优结果。
# -*- coding: utf-8 -*- import os import codecs from sklearn.feature_extraction.text import CountVectorizer, TfidfTransformer from sklearn.manifold import TSNE from sklearn.cluster import KMeans import matplotlib.pyplot as plt import numpy as np import pandas as pd import jieba from sklearn import metrics from sklearn.metrics import silhouette_score from array import array from numpy import * from pylab import mpl from sklearn.metrics.pairwise import cosine_similarity import matplotlib.pyplot as plt import matplotlib as mpl from scipy.cluster.hierarchy import ward, dendrogram #---------------------------------------加载语料------------------------------------- text = open('06-data-fenci.txt').read() print(text) list1=text.split("\n") print(list1) print(list1[0]) print(list1[1]) mytext_list=list1 #控制显示数量 count_vec = CountVectorizer(min_df=20, max_df=1000) #最大值忽略 xx1 = count_vec.fit_transform(list1).toarray() word=count_vec.get_feature_names() print("word feature length: {}".format(len(word))) print(word) print(xx1) print(type(xx1)) print(xx1.shape) print(xx1[0]) #---------------------------------------层次聚类------------------------------------- titles = word #dist = cosine_similarity(xx1) mpl.rcParams['font.sans-serif'] = ['SimHei'] df = pd.DataFrame(xx1) print(df.corr()) print(df.corr('spearman')) print(df.corr('kendall')) dist = df.corr() print (dist) print(type(dist)) print(dist.shape) #define the linkage_matrix using ward clustering pre-computed distances linkage_matrix = ward(dist) fig, ax = plt.subplots(figsize=(8, 12)) # set size ax = dendrogram(linkage_matrix, orientation="right", p=20, labels=titles, leaf_font_size=12 ) #leaf_rotation=90., leaf_font_size=12. #show plot with tight layout plt.tight_layout() #save figure as ward_clusters plt.savefig('07-KH.png', dpi=200) plt.show()
如果你已经解决了该问题, 非常希望你能够分享一下解决方案, 写成博客, 将相关链接放在评论区, 以帮助更多的人 ^-^解决 无用评论 打赏 举报
悬赏问题
- ¥100 yahoo finance api 2024年更改访问限制後的 java串接方法
- ¥15 节日彩灯电路设计电路图
- ¥15 esp32cam串口图传
- ¥15 C# 用partial定义部分类无法快速预览代码
- ¥15 fastreport 代码无法设置最后一页横线不显示
- ¥15 stm32u535芯片usb hid custom类接收数据有问题
- ¥15 ue5.3 pico打包失败 求帮助
- ¥15 请教,这是用chatgpt写的CAD LISPD脚本,需求是画一个由双直线组成的矩形
- ¥50 微信小程序 成功包奶茶啊
- ¥15 计算机博弈的六子棋代码