屿贤 2022-01-16 22:16 采纳率: 100%
浏览 198
已结题

python kmeans聚类后如何获取到分类的数据?

本人在用python做文本聚类分析,由于文本数据过大了,所以可视化看不清层次。请问我想要以数据的形式看到每一个小类应该怎么办呀,我现在只会获取每类的个数和中心点,有没有什么函数或者包呢?

tfidf_vectorizer = TfidfVectorizer(token_pattern=r"(?u)\b\w+\b",ngram_range=(1,1),
                                    max_features=200000,use_idf=True,
                                    )
tfidf_matrix = tfidf_vectorizer.fit_transform(files) #files为原始文本
#使用 K-means 算法进行聚类
mykms = KMeans(n_clusters=4).fit(tfidf_matrix)
#接下去怎么写呢
'''
想得到这样的结果:
第1类:[(xx,dd),(ss,ff),(gg,kk)]
第2类:[(xx,dd),(ss,ff),(gg,kk)]
'''
  • 写回答

2条回答

      报告相同问题?

      相关推荐 更多相似问题

      问题事件

      • 系统已结题 1月25日
      • 已采纳回答 1月17日
      • 创建了问题 1月16日

      悬赏问题

      • ¥15 关于#OpenCV#的问题,如何解决?(语言-qt|开发工具-visual studio)
      • ¥15 centos环境中引入jsoncpp后,编译工程报错,找不到基本库。
      • ¥15 vue3为什么请求在这边获取不到数据呢(关键词-select)
      • ¥20 Multisim仿真设计三路智力抢答装置
      • ¥15 用UML制作简单的语音计算机
      • ¥20 用socket实现ping遇到的问题
      • ¥15 综合的类,这个类里面里面又有构造方法,重载方法,有继承,有重写,有接口
      • ¥15 电脑重置失败无法开机也进不了修复模式,如何解决?
      • ¥100 px4飞控如何设置平飞模式下飞机固定的仰角
      • ¥15 关于#python#的问题:不可以使用max ,min ,exit ,break 的情况下找出哪一年份出生率最高,以及哪一年份出生率最低