python kmeans

我在用sklearn.cluster.Kmeans 练习。
比如现在有6个数据 1,2 3,4 5,6 7,8 0,4 4,0的数据

想请问下 python Kmeans 能设置指定哪几个值是特定的clusters吗？
（比如前 1，2，3为 cluster 1，后 4，5，6 为 cluster 2）
还有如何怎么设置让程序展示每一步的iteration？

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

ilmss 2022-08-22 14:18

关注

基于轮廓系数来选择n_clusters

from sklearn.cluster import KMeans
from sklearn.metrics import silhouette_samples, silhouette_score
import matplotlib.pyplot as plt
import matplotlib.cm as cm
import numpy as np
for n_clusters in [2,3,4,5,6,7]:
    n_clusters = n_clusters
    fig, (ax1, ax2) = plt.subplots(1, 2)
    fig.set_size_inches(18, 7)
    ax1.set_xlim([-0.1, 1])
    ax1.set_ylim([0, X.shape[0] + (n_clusters + 1) * 10])
    clusterer = KMeans(n_clusters=n_clusters, random_state=10).fit(X)
    cluster_labels = clusterer.labels_
    silhouette_avg = silhouette_score(X, cluster_labels)
    print("For n_clusters =", n_clusters,
          "The average silhouette_score is :", silhouette_avg)
    sample_silhouette_values = silhouette_samples(X, cluster_labels)
    y_lower = 10
    for i in range(n_clusters):
        ith_cluster_silhouette_values = sample_silhouette_values[cluster_labels == i]
        ith_cluster_silhouette_values.sort()
        size_cluster_i = ith_cluster_silhouette_values.shape[0]
        y_upper = y_lower + size_cluster_i
        color = cm.nipy_spectral(float(i)/n_clusters)
        ax1.fill_betweenx(np.arange(y_lower, y_upper)
                         ,ith_cluster_silhouette_values
                         ,facecolor=color
                         ,alpha=0.7
                         )
        ax1.text(-0.05
                 , y_lower + 0.5 * size_cluster_i
                 , str(i))
        y_lower = y_upper + 10
    ax1.set_title("The silhouette plot for the various clusters.")
    ax1.set_xlabel("The silhouette coefficient values")
    ax1.set_ylabel("Cluster label")
    ax1.axvline(x=silhouette_avg, color="red", linestyle="--")
    ax1.set_yticks([])
    ax1.set_xticks([-0.1, 0, 0.2, 0.4, 0.6, 0.8, 1])
    colors = cm.nipy_spectral(cluster_labels.astype(float) / n_clusters)
    ax2.scatter(X[:, 0], X[:, 1]
               ,marker='o'
               ,s=8
               ,c=colors
               )
    centers = clusterer.cluster_centers_
    # Draw white circles at cluster centers
    ax2.scatter(centers[:, 0], centers[:, 1], marker='x',
                c="red", alpha=1, s=200)
    
    ax2.set_title("The visualization of the clustered data.")
    ax2.set_xlabel("Feature space for the 1st feature")
    ax2.set_ylabel("Feature space for the 2nd feature")
    plt.suptitle(("Silhouette analysis for KMeans clustering on sample data "
                  "with n_clusters = %d" % n_clusters),
                 fontsize=14, fontweight='bold')
    plt.show()

报告相同问题？

关注问题

python kmeans聚类后如何获取到分类的数据？ kmeans python 有问必答聚类
2022-01-16 22:16

回答 2 已采纳 # 整理聚类结果 listName = dfData['地区'].tolist() # 将 dfData 的首列 '地区' 转换为 listName dictCluster
R语言；kmeans聚类 kmeans r语言聚类
2023-03-03 10:05

回答 8 已采纳以下答案由GPT-3.5大模型与博主波罗歌共同编写：以下是实现k-means聚类的步骤以及代码： Step 1: 读入数据到 R 语言利用 readxl 包读取 Excel 文件里面的数据 libr
kmeans聚类；R语言 r语言聚类
2023-03-06 15:27

回答 10 已采纳 K-means聚类R语言代码： # 读取数据 data <- read.csv("C:/Users/lenovo/Desktop/data.csv", header=TRUE, strings
基于Python编程的RFM细分聚类案例
2023-08-21 21:32

本文将深入探讨一个基于Python编程的RFM细分聚类案例。通过代码实现，我们将学习如何加载和预处理电商历史订单数据，计算RFM指标，使用KMeans算法进行聚类分析，以及如何将用户分为不同的价值层级。最终，我们将通过...
kmeans聚类实现python python 机器学习机器学习算法工程师-陶瑞
2021-03-07 23:56

回答 3 已采纳 matplotlib画出来呗。。。三维以内的都能画
sklearn Kmeans聚类三维列表 kmeans python sklearn
2023-04-13 09:13

回答 1 已采纳将三维列表转换为二维数组。具体来说，可以将三维列表中的每个二维数组展开成一行，并将所有行组成一个大的二维数组。然后将这个二维数组作为输入数据，调用sklearn库中的KMeans函数进行聚类: fro
python聚类错误 kmeans python
2022-12-08 16:58

回答 1 已采纳 https://blog.csdn.net/fuck11111100/article/details/114954399大概原因就是类型不匹配但是你代码里有太多东西没放出来，只能自己查原因了
python实现Kmeans算法
2022-06-30 18:52

一个编程的菜鸡的博客 python实现Kmeans算法
python 数据作图不显示 python 开发语言
2020-03-18 09:18

回答 1 已采纳 https://blog.csdn.net/lg1259156776/article/details/52717445
请问Python K-means算法求 SSE的值 python
2019-05-04 14:34

回答 1 已采纳理论上说,两种都是可以算作是SSE,因为都是在计算所有数据点到与其最近的cluster center的距离总和,越小说明选择的k越适合这个数据.两种方法的不同之处在于: cdist 计算的是eucl
kmeans 图像切割。 py-opencv，报错 kmeans opencv python
2022-02-22 14:23

回答 1 已采纳已解决for j in range(k): # np.mean(r,g,b,label)，属性和label都求个平均值 one_cluster = img_
Python实现Kmeans算法
2022-01-02 14:20

羽路星尘的博客 Python语言手工实现Kemans算法。
使用kmeans遇到的问题 python 深度学习
2020-01-03 20:00

回答 1 已采纳数组的输入维度不正确，要先转换为一维数组再调用。
KMeans算法的Java实现及Python实现.zip
2024-01-14 09:41

Java是一种高性能、跨平台的面向对象编程语言。它由Sun Microsystems（现在是Oracle Corporation）的James Gosling等人在1995年推出，被设计为一种简单、健壮、可移植、多线程、动态的语言。Java的主要特点和优势...
python应用kmeans算法,K-Means算法的Python实现
2021-04-27 05:05

Lay200的博客步骤4 迭代步骤2和步骤3，直至满足退出条件（中心点不再变化） Python代码实现 Python代码如下：导包，初始化图形参数，导入样例数据集 %matplotlib inline from copy import deepcopy import numpy as np import ...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 8月30日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 8月22日

悬赏问题

¥15 微信公众号自制会员卡没有收款渠道啊
¥15 stable diffusion
¥100 Jenkins自动化部署—悬赏100元
¥15 关于#python#的问题：求帮写python代码
¥20 MATLAB画图图形出现上下震荡的线条
¥15 关于#windows#的问题：怎么用WIN 11系统的电脑克隆WIN NT3.51-4.0系统的硬盘
¥15 perl MISA分析p3_in脚本出错
¥15 k8s部署jupyterlab，jupyterlab保存不了文件
¥15 ubuntu虚拟机打包apk错误
¥199 rust编程架构设计的方案有偿

python kmeans

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新