python kmeans聚类后如何获取到分类的数据？

本人在用python做文本聚类分析，由于文本数据过大了，所以可视化看不清层次。请问我想要以数据的形式看到每一个小类应该怎么办呀，我现在只会获取每类的个数和中心点，有没有什么函数或者包呢？

tfidf_vectorizer = TfidfVectorizer(token_pattern=r"(?u)\b\w+\b",ngram_range=(1,1),
                                    max_features=200000,use_idf=True,
                                    )
tfidf_matrix = tfidf_vectorizer.fit_transform(files) #files为原始文本
#使用 K-means 算法进行聚类
mykms = KMeans(n_clusters=4).fit(tfidf_matrix)
#接下去怎么写呢
'''
想得到这样的结果:
第1类：[(xx,dd),(ss,ff),(gg,kk)]
第2类：[(xx,dd),(ss,ff),(gg,kk)]
'''

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

youcans_ 人工智能领域优质创作者 2022-01-17 09:23

关注


    # 整理聚类结果
    listName = dfData['地区'].tolist()  # 将 dfData 的首列 '地区' 转换为 listName
    dictCluster = dict(zip(listName,kmCluster.labels_))  # 将 listName 与聚类结果关联，组成字典
    listCluster = [[] for k in range(nCluster)]
    for v in range(0, len(dictCluster)):
        k = list(dictCluster.values())[v]  # 第v个城市的分类是 k
        listCluster[k].append(list(dictCluster.keys())[v])  # 将第v个城市添加到 第k类
    print("\n聚类分析结果(分为{}类):".format(nCluster))  # 返回样本集的分类结果
    for k in range(nCluster):
        print("第 {} 类：{}".format(k, listCluster[k]))  # 显示第 k 类的结果

本回答被题主选为最佳回答 , 对您是否有帮助呢?

查看更多回答(1条)

报告相同问题？

关注问题

python kmeans聚类后如何获取到分类的数据？ kmeans python 有问必答聚类
2022-01-16 22:16

回答 2 已采纳 # 整理聚类结果 listName = dfData['地区'].tolist() # 将 dfData 的首列 '地区' 转换为 listName dictCluster
Kmeans聚类算法应用问题，八维数据的分类 kmeans python 有问必答聚类
2021-11-08 09:09

回答 1 已采纳分类： km = KMeans(n_clusters=4) km.fit_predict(data) 分完类之后得到了聚类中心，也就是km.cluster_centers_，你可以print出来：
如何将提取到的特征矩阵进行Kmeans的聚类操作 kmeans python 有问必答聚类
2022-04-07 11:20

回答 1 已采纳提供一个思路，多个矩阵你把他的维度reshape到一个一维的向量，这个一维度向量过一个函数得到某一个值，比如求和，比如求方差。这个函数需要你自己根据特征去设计。你得到每个矩阵的值，把所有值resha
Python之kmeans聚类分析
2021-01-27 15:10

Hey_XXP的博客 [Kmeans聚类选择最优K值python实现](https://blog.csdn.net/xyisv/article/details/82430107) [Kmeans算法学习笔记](https://www.cnblogs.com/wuchuanying/p/6218486.html) 动手前可以先看下这三部分，对于一些数据...
kmeans聚类实现python python 机器学习机器学习算法工程师-陶瑞
2021-03-07 23:56

回答 3 已采纳 matplotlib画出来呗。。。三维以内的都能画
R语言，用系统聚类法对数据进行聚类分析，并与Kmeans聚类结果进行比较 r语言有问必答
2021-10-05 19:11

回答 2 已采纳你好，我是有问必答小助手，非常抱歉，本次您提出的有问必答问题，技术专家团超时未为您做出解答本次提问扣除的有问必答次数，将会以问答VIP体验卡（1次有问必答机会、商城购买实体图书享受95折优惠）的形式为
R语言；kmeans聚类 kmeans r语言聚类
2023-03-03 10:05

回答 8 已采纳以下答案由GPT-3.5大模型与博主波罗歌共同编写：以下是实现k-means聚类的步骤以及代码： Step 1: 读入数据到 R 语言利用 readxl 包读取 Excel 文件里面的数据 libr
【机器学习】全面解析Kmeans聚类算法（Python）
2021-12-27 10:00

风度78的博客一、聚类简介Clustering (聚类)是常见的unsupervised learning (无监督学习)方法，简单地说就是把相似的数据样本分到一组（簇），聚类的过程，我们并不清楚某一类...
sklearn Kmeans聚类三维列表 kmeans python sklearn
2023-04-13 09:13

回答 1 已采纳将三维列表转换为二维数组。具体来说，可以将三维列表中的每个二维数组展开成一行，并将所有行组成一个大的二维数组。然后将这个二维数组作为输入数据，调用sklearn库中的KMeans函数进行聚类: fro
kmeans聚类；R语言 r语言聚类
2023-03-06 15:27

回答 10 已采纳 K-means聚类R语言代码： # 读取数据 data <- read.csv("C:/Users/lenovo/Desktop/data.csv", header=TRUE, strings
kmeans++聚类聚成这样合理吗 kmeans 机器学习聚类
2021-11-13 16:07

回答 1 已采纳唉，终究是解决了，求均值的时候X[y_pred==i].mean()没加axis=0顺便把新实现的代码贴一下吧 import numpy as np import matplotlib.pyplot
请给出python的Kmeans聚类代码
2023-02-18 22:16

贫僧法号止尘的博客 KMeans聚类代码的python实现如下：from sklearn.cluster import KMeans# 定义要聚类的数据集 X = [[1,2], [3,4], [5,6], [7,8], [9, 10]]# 定义KMeans聚类模型 kmeans = KMeans(n_clusters=2, random_state=0).fit(X...
运用kmeans 算法对数据进行聚类 python
2022-05-05 10:03

回答 1 已采纳可以参考https://blog.csdn.net/BF02jgtRS00XKtCx/article/details/89037409
全面解析 Kmeans 聚类算法（Python）
2021-12-31 17:00

AI科技大本营的博客作者 | 泳鱼来源 | 算法进阶一、聚类简介Clustering (聚类)是常见的unsupervised learning (无监督学习)方法，简单地说就是把相似的数据样本分到一组（簇）...
【机器学习】吴恩达作业7.0，python实现kmeans聚类
2022-04-02 20:41

—Xi—的博客 7.0 k-means聚类以及图像压缩使用k-means聚类算法并且将其应用于压缩图像。在第二部分中你将使用主成分分析来找到脸部图像的一个低维表示。第一部分为k-means聚类，首先从一个2维的样本集开始，他可以帮助你对k-...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 1月25日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 1月17日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 1月16日

悬赏问题

¥20 机器学习能否像多层线性模型一样处理嵌套数据
¥20 西门子S7-Graph,S7-300，梯形图
¥50 用易语言http 访问不了网页
¥50 safari浏览器fetch提交数据后数据丢失问题
¥15 matlab不知道怎么改，求解答！！
¥15 永磁直线电机的电流环pi调不出来
¥15 用stata实现聚类的代码
¥15 请问paddlehub能支持移动端开发吗？在Android studio上该如何部署？
¥20 docker里部署springboot项目，访问不到扬声器
¥15 netty整合springboot之后自动重连失效

python kmeans聚类后如何获取到分类的数据？

2条回答 默认 最新

问题事件

悬赏问题

2条回答默认最新