一种kmeans初始聚类中心选取方法

方法如图所示：(https://img-ask.csdn.net/upload/201505/09/1431153790_310284.png)

第一个点随机选取，第二个点是距离第一个最远的点，第三个点还有之后该怎么选？方法中说说的什么最近距离最大啥的根本看不懂，我理解是第三个点采取标准是与前两个点的距离之和最大，但是这样好像不对。

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
foreach_break 2015-05-09 07:27
关注
学习数据挖掘和机器学习，推荐你去参考经典的教材，而不是看一些自身水准未达标的博客文章。

聚类的实质是什么？

你看看下面的图，是不是最后形成了一个一个的簇（红簇、绿簇、蓝簇），簇是什么？就是簇里面的点都紧紧围绕着一个核心。

这个核心就是簇的代表。

所以找出了一个一个的核心，就相当于找出了类的代表，这个就是簇心的寻找过程。

那么在初始阶段，就是k阶段，你得预先指定好了，你要聚出几个类，或者说你要指定出几个簇心？

第一个簇心A随机找，是因为一开始你不知道哪个是簇心；
第二个簇心B要找距离A最远的，是因为簇心之间要相距远一些，如果很近的话，很容易当作一类，影响聚类效果；
第三个簇心C也是同样的，它得离A、B远一些；
其它依次类推。

指定好簇心后，你就开始按means方式来迭代聚类，直至所有的簇心稳定不再移动。

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

Kmeans聚类算法应用问题，八维数据的分类 kmeans python 有问必答聚类
2021-11-08 09:09

回答 1 已采纳分类： km = KMeans(n_clusters=4) km.fit_predict(data) 分完类之后得到了聚类中心，也就是km.cluster_centers_，你可以print出来：
如何将提取到的特征矩阵进行Kmeans的聚类操作 kmeans python 有问必答聚类
2022-04-07 11:20

回答 1 已采纳提供一个思路，多个矩阵你把他的维度reshape到一个一维的向量，这个一维度向量过一个函数得到某一个值，比如求和，比如求方差。这个函数需要你自己根据特征去设计。你得到每个矩阵的值，把所有值resha
运用kmeans 算法对数据进行聚类 python
2022-05-05 10:03

回答 1 已采纳可以参考https://blog.csdn.net/BF02jgtRS00XKtCx/article/details/89037409
kmeans python自定义初始聚类中心_聚类算法——K-Means原理、k选择、质心初始化、Python实现...
2021-03-03 15:38

weixin_33389183的博客引入聚类是一种无监督学习，将相似的样本(对象/实例)归到同一簇(cluster)中。通常用样本的相似度或距离来衡量。eg:天空中的星星，靠得近的星星可以被归为一个星团，而星团之间的星星距离比较远。(CheungRN：聚类算法...
python kmeans聚类后如何获取到分类的数据？ kmeans python 有问必答聚类
2022-01-16 22:16

回答 2 已采纳 # 整理聚类结果 listName = dfData['地区'].tolist() # 将 dfData 的首列 '地区' 转换为 listName dictCluster
kmeans++聚类聚成这样合理吗 kmeans 机器学习聚类
2021-11-13 16:07

回答 1 已采纳唉，终究是解决了，求均值的时候X[y_pred==i].mean()没加axis=0顺便把新实现的代码贴一下吧 import numpy as np import matplotlib.pyplot
R语言，用系统聚类法对数据进行聚类分析，并与Kmeans聚类结果进行比较 r语言有问必答
2021-10-05 19:11

回答 2 已采纳你好，我是有问必答小助手，非常抱歉，本次您提出的有问必答问题，技术专家团超时未为您做出解答本次提问扣除的有问必答次数，将会以问答VIP体验卡（1次有问必答机会、商城购买实体图书享受95折优惠）的形式为
kmeans++选择初始聚类中心的方法
2021-07-28 12:57

一个联邦学习小白的博客
R语言；kmeans聚类 kmeans r语言聚类
2023-03-03 10:05

回答 8 已采纳以下答案由GPT-3.5大模型与博主波罗歌共同编写：以下是实现k-means聚类的步骤以及代码： Step 1: 读入数据到 R 语言利用 readxl 包读取 Excel 文件里面的数据 libr
聚类算法/ip聚类/可视化 kmeans 算法聚类
2023-02-19 16:37

回答 9 已采纳针对日志分析可视化中使用聚类算法的问题，以下是一些思路和建议： 1.确定聚类算法：首先需要选择一种适合日志数据的聚类算法，例如k-means、层次聚类等。选择算法时需要考虑数据量、数据维度、聚类结果的
sklearn中kmeans如何返回各个聚类中心坐标机器学习
2020-06-25 16:29

回答 1 已采纳 https://www.cnblogs.com/mfryf/p/9007527.html
Python实现的KMeans聚类算法实例分析
2021-01-20 05:50

一、关于初始聚类中心的选取初始聚类中心的选择一般有：（1）随机选取（2）随机选取样本中一个点作为中心点，在通过这个点选取距离其较大的点作为第二个中心点，以此类推。（3）使用层次聚类等算法更新出初始...
kmeans聚类；R语言 r语言聚类
2023-03-06 15:27

回答 10 已采纳 K-means聚类R语言代码： # 读取数据 data <- read.csv("C:/Users/lenovo/Desktop/data.csv", header=TRUE, strings
kmeans python自定义初始聚类中心_聚类--K均值算法：自主实现与sklearn.cluster.KMeans调用...
2020-12-10 16:34

weixin_39544333的博客 1.用python实现K均值算法K-means是一个反复迭代的过程，算法分为四个步骤：(x,k,y)1) 选取数据空间中的K个对象作为初始中心，每个对象代表一个聚类中心；def initcenter(x, k): kc2) 对于样本中的数据对象，根据它们...
kmeans聚类算法的matlab实现
2023-02-01 21:07

kmeans聚类算法是一种迭代求解的聚类分析算法。其实现步骤如下： (1) 随机选取K个对象作为初始的聚类中心 (2) 计算每个对象与各个种子聚类中心之间的距离，把每个对象分配给距离它最近的聚类中心。 (3) 聚类中心以及...
没有解决我的问题, 去提问

悬赏问题

¥15 关于#matlab#的问题：期望的系统闭环传递函数为G(s)=wn^2/s^2+2¢wn+wn^2阻尼系数¢=0.707，使系统具有较小的超调量
¥15 FLUENT如何实现在堆积颗粒的上表面加载高斯热源
¥30 截图中的mathematics程序转换成matlab
¥15 动力学代码报错，维度不匹配
¥15 Power query添加列问题
¥50 Kubernetes&Fission&Eleasticsearch
¥15 報錯：Person is not mapped，如何解決？
¥15 c++头文件不能识别CDialog
¥15 Excel发现不可读取的内容
¥15 关于#stm32#的问题：CANOpen的PDO同步传输问题

一种kmeans初始聚类中心选取方法

2条回答 默认 最新

悬赏问题

2条回答默认最新