有一组数据，维度为182，4如何进行kmean聚类分析？如何实现代码？

通过学习书本，想实现对这个维度数组进行kmean聚类，通过for循环查看聚类数为多少是最合理的？

这是通过学习书本上，了解到鸢尾花的模型，这个是随机的模型，查看到iris_data与iris_target都是直接获取的，但是我这个源数据如何获取相对应的数据，源数据本身可以使用data代替，求大神解答

from sklearn.metrics import fowlkes_mallows_score
for i in range(2,7):
    #构建并训练模型
    kmeans = KMeans(n_clusters=i,random_state=123).fit(iris_data)
    score = fowlkes_mallows_score(iris_target,kmeans.labels_)
    print('iris数据聚%d类FMI评价分值为：%f'%(i,score))

这个是我的源数据，其中NAN已经处理了，可以忽略

                    incomeperperson  internetuserate  urbanrate
country                                                        
Afghanistan                     NaN         3.654122      24.04
Albania                 1914.996551        44.989947      46.72
Algeria                 2231.993335        12.500073      65.22
Andorra                21943.339900        81.000000      88.92
Angola                  1381.004268         9.999954      56.70
...                             ...              ...        ...
Vietnam                  722.807559        27.851822      27.84
West Bank and Gaza              NaN        36.422772      71.90
Yemen, Rep.              610.357367        12.349750      30.64
Zambia                   432.226337        10.124986      35.42
Zimbabwe                 320.771890        11.500415      37.34

这是我修改后的，但是报错了，这是报错内容：labels_true must be 1D: shape is (182, 3)。没有数据标签集，我理解的标签集是国家名，这个理解是不是错误了？求大神解答

num = data.iloc[:,1:]
print(num)
from sklearn.metrics import fowlkes_mallows_score
for i in range(2,7):
    #构建并训练模型
    kmeans = KMeans(n_clusters=i,random_state=123).fit(num)
    score = fowlkes_mallows_score(num,kmeans.labels_)
    print('数据聚%d类FMI评价分值为：%f'%(i,score))

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
11FIGHT11 2021-10-19 20:16
关注
from sklearn.metrics import fowlkes_mallows_score
from sklearn.cluster import KMeans
from sklearn.datasets import load_iris
iris = load_iris()
print(iris.data)
print(iris.target)
for i in range(2,7):
#构建并训练模型
kmeans = KMeans(n_clusters=i,random_state=123).fit(iris.data)
score = fowlkes_mallows_score(iris.target,kmeans.labels_)
print('iris数据聚%d类FMI评价分值为：%f'%(i,score))
上述代码运行出来了
iris数据聚2类FMI评价分值为：0.750473
iris数据聚3类FMI评价分值为：0.820808
iris数据聚4类FMI评价分值为：0.753970
iris数据聚5类FMI评价分值为：0.725483
iris数据聚6类FMI评价分值为：0.614345

解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

Python之kmeans聚类分析
2021-01-27 15:10

Hey_XXP的博客 [Kmeans—sklearn—聚类分析详解](https://www.cnblogs.com/zywnnblog/p/14256224.html) [Kmeans聚类选择最优K值python实现]...动手前可以先看下这三部分，对于一些数据分析类项目一定要了解对应算法以及
聚类分析
2021-01-13 22:50

Not found的博客在大部分的学科中，时间序列是数据的一种常见表示形式。对于时间序列处理来说，一个普遍的任务就是比较两个序列的相似性。在时间序列中，我们通常需要比较两端音频的差异。而这两段音频的长度大部分是不相等的。在...
机器学习算法——详细的介绍聚类算法的实现原理（以Kmean算法为中心的优化算法、以及sklearn如何实现）
2021-03-09 20:09

Ma Sizhou的博客目录一、聚类算法简介1、认识聚类算法1.1 聚类算法在现实中的应用1.2 聚类算法的概念1.3 聚类算法与分类算法最大的区别小结：二、聚类算法api初步使用1、api介绍2、案例2.1流程分析2.2 代码实现小结:三、聚类算法...
读书笔记-增强型分析：AI驱动的数据分析、业务决策与案例实践
2024-02-21 21:09

代码不会写的博客运用人工智能技术，可以使人类社会变得更美好。人们总是期待产品更适合、服务更贴心、生活更便利。在实践中，技术给企业赋能，企业通过优质的产品和服务满足社会，提升人类福祉。很多金融企业已经开始尝试向潜在客户...
聚类之K-means分析以及优缺点
2020-07-01 20:10

Geeker4的博客 K-Means是最为经典的无监督聚类（Unsupervised Clustering）算法，其主要目的是将n个样本点划分为k个簇，使得相似的样本尽量被分到同一个聚簇。K-Means衡量相似度的计算方法为欧氏距离（Euclid Distance）。 K-Means...
聚类算法
2020-12-11 18:16

adamyoungjack的博客一种典型的无监督学习算法，主要用于将相似的样本自动归到一个类别中。 1.3 聚类算法与分类算法最大的区别聚类算法是无监督的学习算法，而分类算法属于监督的学习算法。 1.4 聚类算法api初步使用 sklearn.cluster....
[机器学习与scikit-learn-25]：算法-聚类-KMeans的适用范围与评估指标
2022-03-17 08:18

文火冰糖的硅基工坊的博客 1.3 不适合场合下的错误聚类第2章 KMeans效果评估面临的问题 2.1 概述 2.2 KMeans的Inertia指标面临的问题第3章 KMeans效果评估的方法 3.1当真实标签已知的时候 3.2当真实标签未知的时候：基本思想 3.3当.....
Kaggle英国电商数据分析--k-means与RFM模型结合进行用户群体划分
2021-11-28 14:35

数数chat的博客此次的数据集来自kaggle的关于在线零售业务的交易数据，该公司主要销售礼品，大部分出售对象是面向批发商。数据链接数据集字段介绍数据包含541910行，8个字段，字段内容为： InvoiceNo: 订单编号，每笔交易有6个...
人工智能-机器学习-KMeans聚类
2021-10-15 23:46

纯洁的小魔鬼的博客 k均值聚类算法（k-means clustering algorithm）是一种迭代求解的聚类分析算法，属于无监督学习的一种，其步骤是，预先将数据分为K组，则随机选取K个对象作为初始的聚类中心，然后计算每个对象与各个聚类中心之间的...
关键帧提取——聚类法提取关键帧(4)
2020-04-26 22:05

mxYlulu的博客聚类的复杂度是并不低的，所以我们需要通过降低数据的维度来进行计算。主成分分析简单介绍即PCAPCAPCA 这里我们使用PCAPCAPCA提取图像特征。 PCAPCAPCA主要用于数据降维，对于高纬向量可以用PCAPCAPCA求出其投影...
sklearn初探（六）：K-means方法聚类及可视化
2020-05-13 23:16

swy_swy_swy的博客本次任务为使用k-means算法对青蛙叫声MFCC数据集进行聚类分析。给定数据全部为有标数据，共分为四类。由于数据维数较高，可视化之前需要降维，这里采用t-sne算法降维，最后使用matplotlib将聚类结果可视化。数据集...
聚类算法KMeans
2021-11-20 21:41

功夫大笨鲨的博客例如：随着人工智能的不断发展，机器学习这门技术也越来越重要，很多人都开启了学习机器学习，本文就介绍了机器学习的基础内容。一、KMeans KMeans可以说是最简单的聚类算法没有之一 1.1 KMeans是如何工作的关键...
Pandas高级数据分析快速入门——全过程综述及案例集锦
2021-10-14 17:06

肖永威的博客 Pandas高级数据分析快速入门包括开发环境、基础操作、数据挖掘与统计分析篇、数据可视化、机器学习特征工程、机器学习预测分析等培训内容综述与集成。（5次课，共计交流10小时，内附代码案例）
python 机器学习（一）无监督学习 + 监督学习 + 聚类算法 + k-means算法自实现
2019-11-25 20:07

missing walker的博客 人工智能基础（数据分析、数据挖掘）3. 数据分析、与数据挖掘的区别4. 无监督学习5，监督学习6. 无监督学习和监督学习的区别7. 聚类算法8. k-means算法自实现9. KMeans算法实现聚类一、机器学习 1. 概念在历史...
numpy实现周志华机器学习 9.4.3 高斯混合聚类（GMM算法）
2020-03-01 22:26

书剑与酒的博客本文主要参考周志华《机器学习》的9.4.3章节，对高斯混合聚类的原理做简单介绍，并使用numpy实现GMM。要想很好得理解掌握高斯混合聚类算法，以我的学习经验来看，需要掌握两方面背景知识。多维正态分布 EM算法 ...
k-means、k-means++、kernel k-means算法介绍及在datasets-load_iris数据集上的实现
2021-05-19 17:33

博o_Oer~的博客文章目录k-means、k-means++、kernel k-means算法介绍及在datasets-load_iris数据集实现完整实验代码k-means公式数据集处理选取初始类中心单次k-means运算兰德指数对聚类结果评判运行结果正确结果每一轮迭代的结果...
scikit-learn中的KMeans聚类实现
2018-09-16 20:33

人工智能之浪潮的博客在这篇文章中：一、scikit-learn中的Kmeans介绍 1、相关理论 2、主函数KMeans ... 三、sklearn中的cluster进行kmeans聚类延伸一：数据如何做标准化延伸二：Kmeans可视化案例之前一直用R，现...
使用Kmeans进行图像聚类
2023-09-05 20:30

小北的北的博客 Kmeans可以用于与发现聚类相关的其他任务介绍聚类是一种无监督机器...使用它，可以对常规数据进行聚类，还可以执行其他任务，例如图像中的颜色聚类以及用于进一步分类的降维。让我们更详细地了解一下。KmeansKmea...
没有解决我的问题, 去提问

悬赏问题

¥15 素材场景中光线烘焙后灯光失效
¥15 请教一下各位，为什么我这个没有实现模拟点击
¥15 执行 virtuoso 命令后，界面没有，cadence 启动不起来
¥50 comfyui下连接animatediff节点生成视频质量非常差的原因
¥20 有关区间dp的问题求解
¥15 多电路系统共用电源的串扰问题
¥15 slam rangenet++配置
¥15 有没有研究水声通信方面的帮我改俩matlab代码
¥15 ubuntu子系统密码忘记
¥15 保护模式-系统加载-段寄存器

有一组数据，维度为182，4如何进行kmean聚类分析？如何实现代码？

3条回答 默认 最新

悬赏问题

3条回答默认最新