Hakutaku 2019-05-04 06:34 采纳率: 100%
浏览 3515
已采纳

请问Python K-means算法 求 SSE的值

题目要求是:produce a plot of the SSE value of the k-means clustering of the dataset(y-axis),versus k value (x axis)。
k 的范围是2-26。

我在网上看到两种写法
一种是cdist
图片说明
另外一种是 km.inertia_
图片说明

请问这两种区别是什么,到底哪个才是求SSE的值,哪一种才符合题目要求?

  • 写回答

1条回答 默认 最新

  • weijun05 2019-05-05 02:46
    关注

    理论上说,两种都是可以算作是SSE,因为都是在计算所有数据点到与其最近的cluster center的距离总和,越小说明选择的k越适合这个数据.两种方法的不同之处在于:
    cdist 计算的是euclidean distance,而km.inertia 计算的是squared distance, 也就是说一个算的是我们常用的距离的概念, 而另一个算了距离的平方. 两种操作都不影响最后对k 的选择, 后者无非是省略了一步开方运算罢了.

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
编辑
预览

报告相同问题?

悬赏问题

  • ¥15 IBMP550小型机使用串口登录操作系统
  • ¥15 关于#python#的问题:现已知七自由度机器人的DH参数,利用DH参数求解机器人的逆运动学解目前使用的PSO算法
  • ¥15 发那科机器人与设备通讯配置
  • ¥15 Linux环境下openssl报错
  • ¥15 我在使用VS编译并执行之后,但是exe程序会报“无法定位程序输入点_kmpc_end_masked于动态链接库exe上“,请问这个问题有什么解决办法吗
  • ¥15 el-select光标位置问题
  • ¥15 单片机 TC277 PWM
  • ¥15 在更新角色衣服索引后,Sprite 并未正确显示更新的效果该如何去解决orz(标签-c#)
  • ¥15 VAE代码如何画混淆矩阵
  • ¥15 求遗传算法GAMS代码
手机看
程序员都在用的中文IT技术交流社区

程序员都在用的中文IT技术交流社区

专业的中文 IT 技术社区,与千万技术人共成长

专业的中文 IT 技术社区,与千万技术人共成长

关注【CSDN】视频号,行业资讯、技术分享精彩不断,直播好礼送不停!

关注【CSDN】视频号,行业资讯、技术分享精彩不断,直播好礼送不停!

客服 返回
顶部