如何在约束条件”每个簇内的西瓜样本数量是一样多的“（每个簇有10个西瓜数据）前提下，把这30个西瓜数据聚类分成3个簇？

博主您好，拜读了您《Python实现聚类K-means算法》这篇文章(https://blog.csdn.net/wyn1564464568/article/details/125782286?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522170032756216800226592639%2522%252C%2522scm%2522%253A%252220140713.130102334..%2522%257D&request_id=170032756216800226592639&biz_id=0&utm_medium=distribute.pc_search_result.none-task-blog-2~blog~baidu_landing_v2~default-4-125782286-null-null.nonecase&utm_term=Python%E5%AE%9E%E7%8E%B0%E8%81%9A%E7%B1%BBK-means%E7%AE%97%E6%B3%95&spm=1018.2226.3001.4450)
个人在想改造一下这部分代码，有个想法请教：

在约束条件”每个簇内的西瓜样本数量是一样多的“（每个簇有10个西瓜数据）前提下，把这30个西瓜数据聚类分成3个簇，：

但是运行程序后，聚类分布示意图里总有两个数据点出现异常，不能实现”每个簇有10个西瓜数据“。麻烦博主帮忙分析一下如何改进代码（自己修改过的代码片段如下）。

    # 清空对簇的划分，对应上面算法的第3行
    clusters = []
    c = []
    for i in range(k):
        clusters.append([])
        c.append([])

    # 这个for对应上面算法的4-8行
    for melon in melons:
        '''
        argmin 函数找出容器中最小的下标，在这里这个目标容器是：
        list(map(lambda vec: np.linalg.norm(melon - vec, ord = 1), mean_vectors)),
        它表示melon与mean_vectors中所有向量的距离列表。
        (numpy.linalg.norm计算向量的范数,ord = 1即曼哈顿范数，ord = 2即欧几里得范数或模长)
        '''
        L = list(map(lambda vec: np.linalg.norm(melon - vec, ord=1), mean_vectors))
        # 表示melon与mean_vectors中所有向量的曼哈顿距离列表
        for i in range(k):
            c[i] = np.argmin(L)  # 取最小距离对应的下标值，存入c
            if len(clusters[c[i]]) < 10:  
                clusters[c[i]].append(melon)
                break  # 如果最小距离值下标对应的样本簇，簇内样本数量少于10，则将该样本加入该簇
            else:
                L[c[i]] = 999999
                # 否则，将最小距离c[i]定义无穷大，并继续重复上述步骤

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

11条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
threenewbee 2023-11-19 07:31
关注
if rnd > ROUND_LIMIT or change < THRESHOLD: break

这里的阈值你调整下看看
我感觉博主的程序有点凑出来的感觉。本身这些数据你就是肉眼看也看不出来明显的聚类（如果都是黑色的点），强行划分了3类而已。
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 3
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(10条)

报告相同问题？

关注问题

老婆给当程序员的老公打电话：“下班顺路买10个包子带回来，如果看到卖西瓜的，就买1个 python
2021-11-09 22:35

回答 1 已采纳 x = input("输入: ") if x == "Y": print(1) elif x == "N": print(10) else: print("error")
1020个西瓜一天卖一半加两个几天卖完 c语言
2021-10-31 15:00

回答 1 已采纳判断条件是 rem>0
【c语言】：一个简单递归算法的调用：1020个西瓜几天后能卖完 c++ c语言开发语言
2019-03-08 17:49

回答 3 已采纳 fun 变量的返回值没有保存下来 ``` #include int fun(int n,int t) { int left = n - n/2 -2;
基于朴素贝叶斯分类器的西瓜数据集 2.0 预测分类_朴素贝叶斯算法知识点总结...
2020-11-24 06:41

weixin_39564605的博客贝叶斯原理建立在主观判断的基础上：在我们不了解所有客观事实的情况下，同样可以先估计一个值，然后根据实际结果不断进行修正。贝叶斯公式实际上，贝叶斯公式就是求阶后验概率的。朴素贝叶斯它是一种简单但极为...
关于#这个#的问题，如何解决？ c++
2022-10-06 15:43

回答 1 已采纳这个判断条件 if(n%a==0 && n%b==3 || n>=100 )里的 || 改为&&即可。n%a==0保证萌萌要求N元正好买完苹果；n%b==3保证瞳瞳要求N元买完西瓜剩余3元；然后
多个form表单数据一修改全变了，求解 vue.js
2019-04-01 18:12

回答 3 已采纳 ``` ``` index为div循环的下标然后再data中定义一个mode
请问这个程序有什么问题 c++ 有问必答
2021-12-29 23:43

回答 3 已采纳 struct定义后要加分号
机器学习入门基础（万字总结）（建议收藏！！！）
2022-12-04 22:36

subsistent的博客介绍机器学习的基础概念和知识，包括机器学习简史、主要流派、与人工智能、数据挖掘的关系、应用领域、算法、一般流程等。伴随着计算机计算能力的不断提升以及大数据时代的迅发展人工智能也取得了前所未有的进步。
用python语言计算西瓜几天后可以卖完 python
2021-11-07 21:54

回答 1 已采纳 n=1020 d=0 while n>0: d+=1 n=n//2-2 print(d)
现在有两个微信菜单列表的json格式，如何将两个json合并为一个？ eclipse java tomcat 微信微信公众平台
2020-05-16 10:31

回答 1 已采纳你的第一个json和第二个json放在一起不知道怎么分开。你可以创建一个对象，里面是你的新的button 然后把两个json里面原来的button作为subbutton放进去，再循环把各自的su
可以为一个三本大学生做个职业规划吗？职场和发展
2022-06-21 12:39

回答 26 已采纳我也是三本。17年毕业，目前是在一家互联网公司做Java后端。我身边也有一些同学是做前端的。以我的经历来说，在刚毕业的起薪上前端甚至要比后端高一些。但是后劲有点不足。我工作的地方在北京，目
赋能金融风控加分项的这30个问题，您都搞懂了吗
2022-07-26 22:49

番茄风控的博客赋能金融风控加分项的这30个问题，您都搞懂了吗
sql如何把一个表的字段当做另一个表的值去关联 mysql sql 数据库
2022-07-20 19:28

回答 5 已采纳每个年级有多个班级，你在班级表里面增加一个年级表的ID字段。这样应该就满足您的要求了。年级表伪码：table_nianji{id int primary, --年级IDname varchar --
西瓜书重温(七): 贝叶斯分类器(手推+代码demo)
2022-06-24 19:15

翻滚的小@强的博客当然，这个学习过程和我们之前学习的像SVM，神经网络等思路不太一样，这其实涉及到统计学界参数估计的两个经典学派: 频率学派和贝叶斯学派了，当然，也产生了两种相差比较远的估计方法(极大似然估计与贝叶斯估计)， ...
Flink 在字节跳动数据流的实践
2022-06-12 14:29

倾听铃的声的博客数据流处理的主要是埋点日志。埋点，也叫 Event Tracking，是数据和业务之间的桥梁，是数据分析、推荐、运营的基石。用户在使用 App、小程序、Web 等各种线上应用时产生的行为，主要通过埋点的形式进行采集上报，按...
【机器学习】习题集合
2023-11-25 13:27

花未眠..的博客绪论单选题下列有关机器学习基本术语说法错误的是() A 从训练数据中学得模型的过程称为“学习”或“训练” B 训练过程中使用的数据称为“训练数据”,每一个样本称为一个“训练样本”,训练样本组成的集合称为“训练...
西瓜笔记(三下)
2018-09-21 22:43

Angela㐅cc的博客一、贝叶斯网(Bayesian ...若两个属性有直接的依赖关系，用一条有向边连接。如下，属性B依赖属性A。量化的依赖关系是P(B|A)。二、结构有了贝叶斯的网络，我们就可以得到属性x1，x2...xn的联合概率分布。如...
西瓜书笔记
2023-11-07 17:50

Moliay的博客 A、所有样本的权重和保持不变B、前一个基学习器分错的样本会获得更大的权重C、只要权重调整的方向正确，Boosting算法的性能就可以获得理论保证D、决策树可以直接处理带权重的样本解析：CBoosting是一种____ (同质/...
时序差分方法：Q-learning、SARSA和SARSA-Lambda【附带三个算法的代码实现】
2022-07-11 09:00

奋斗的西瓜瓜的博客本文详细介绍了强化学习中的时序差分方法，主要涉及Q-Learning算法、SARSA...附带了这三个算法的代码实现，其中，SARSA算法和多步SARSA算法是基于CartPole-v0环境的，Q-Learning算法是基于Pendulum0v0环境的。......
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已结题（查看结题原因） 11月24日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 11月20日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 11月19日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 11月19日
展开全部

悬赏问题

¥15 Windows Script Host 无法找到脚本文件"C:\ProgramData\Player800\Cotrl.vbs”
¥15 matlab自定义损失函数
¥15 35114 SVAC视频验签的问题
¥15 impedancepy
¥15 求往届大挑得奖作品（ppt…）
¥15 如何在vue.config.js中读取到public文件夹下window.APP_CONFIG.API_BASE_URL的值
¥50 浦育平台scratch图形化编程
¥20 求这个的原理图只要原理图
¥15 vue2项目中，如何配置环境，可以在打完包之后修改请求的服务器地址
¥20 微信的店铺小程序如何修改背景图

如何在约束条件”每个簇内的西瓜样本数量是一样多的“（每个簇有10个西瓜数据）前提下，把这30个西瓜数据聚类分成3个簇？

11条回答 默认 最新

问题事件

悬赏问题

11条回答默认最新