屿贤 2022-01-16 22:16 采纳率: 100%
浏览 282
已结题

python kmeans聚类后如何获取到分类的数据?

本人在用python做文本聚类分析,由于文本数据过大了,所以可视化看不清层次。请问我想要以数据的形式看到每一个小类应该怎么办呀,我现在只会获取每类的个数和中心点,有没有什么函数或者包呢?

tfidf_vectorizer = TfidfVectorizer(token_pattern=r"(?u)\b\w+\b",ngram_range=(1,1),
                                    max_features=200000,use_idf=True,
                                    )
tfidf_matrix = tfidf_vectorizer.fit_transform(files) #files为原始文本
#使用 K-means 算法进行聚类
mykms = KMeans(n_clusters=4).fit(tfidf_matrix)
#接下去怎么写呢
'''
想得到这样的结果:
第1类:[(xx,dd),(ss,ff),(gg,kk)]
第2类:[(xx,dd),(ss,ff),(gg,kk)]
'''
  • 写回答

2条回答 默认 最新

      报告相同问题?

      相关推荐 更多相似问题

      问题事件

      • 系统已结题 1月25日
      • 已采纳回答 1月17日
      • 创建了问题 1月16日

      悬赏问题

      • ¥15 Multisim14.0软件安装
      • ¥15 一块GD32F105芯片的主板。怎么找RXD和TXD串口
      • ¥15 磁盘异常导致工业相机GigE传图卡顿
      • ¥20 python中使用chatgpt为什么一直连接失败
      • ¥50 使用grpc遇到的问题
      • ¥100 运算速度优化问题,控制在四秒以内
      • ¥15 如何用matlab画出这样的图
      • ¥15 线性回归问题进行特征缩放后,为什么求得的参数不对了
      • ¥15 python爬取网页信息(主要为期刊影响因子、官网等),已有ISSN进行检索,但爬取过程找不到class该怎么办?
      • ¥15 找出5阶幻方的所有解的个数:275305224