关于#python#的问题，如何解决？

python在跑k均值聚类时候的时候，每次运行结果都不一样，求帮忙瞅瞅是哪出问题了？

import numpy as np
from sklearn.datasets import load_iris
iris = load_iris()
x,y =iris.data,iris.target
#x=np.array([[1,1,1,1],[10,10,10,10],[20,20,20,20],[5,5,5,5],[3,3,3,3],[6,6,6,6],[25,25,25,25]])
centroids_a=[]
list1=[]
#聚类中心
def init_random_centroids(k,x):
    data1=x.shape[0]
    suiji_a =np.random.choice(data1,k,replace=False)
    for i in suiji_a:
        xlist = x[i]
        centroids_a.append(xlist)
        centroids =np.array(centroids_a)
    return centroids


#计算距离
def euclidean_distance(one_sample, x):
    #print("中心点",x)
    #print("样本",one_sample)
    #print("单个样本",one_sample)
    #print("中心",x)
    distances= np.sum((x-one_sample)**2)
    #print("距离",distances)
    return distances


#返回离样本最近的中心索引
def _closest_centroid(sample, centroids):
    k = centroids.shape[0]
    #print("k",k)
    #print("聚类中心",centroids)
    list_distance =[]
    for i in range(k):
        a=euclidean_distance(one_sample=sample, x=centroids[i])
        list_distance.append(a)
        # print("list",list_distance)
        distance_list=np.array(list_distance)
        id =np.argmin(distance_list)
    #print("单个样本与聚类中心的距离：",distance_list)
    #print("距离最近的中心索引",id)
    return id

#将所有样本进行归类，归类规则就是将该样本归类到与其最近的中心
def create_clusters(k,centroids, x):
    clusters = [[] for _ in range(k)]
    #print("cen",centroids)
    for sample in x:
        ys=_closest_centroid(sample, centroids)
        #print(ys)
        clusters[ys].append(sample)
    #print("0",clusters[0])
    #print("1",clusters[1])
    #print("2",clusters[2])
    return clusters

#中心点更新
def update_centroids(k,clusters):
    #print(k)
    # print("类型0",clusters[0])
    # print("类型1",clusters[1])
    # print("类型2",clusters[2])
    for i in range(k):
        centroid = np.mean(clusters[i], axis=0)
        #print("平均聚点",centroid)
        centroids[i] = centroid
    print("新聚类中心",centroids)
    return centroids


# 将所有样本进行归类，其所在的类别的索引就是其类别标签
def get_cluster_labels(clusters, x):
    #print(clusters)
    y_pred = []
    for sample in x:
        ys=_closest_centroid(sample=sample, centroids=centroids)
        y_pred.append(ys)
    print(y_pred)
    return y_pred



#随机选取k个聚类中心
centroids = init_random_centroids(3, x)
for number in range(20000000):
    #样本归类
    cluster = create_clusters(k=3,centroids=centroids,x=x)
    former_centroids = centroids
    #更新新的聚类中心
    clusters = update_centroids(k=3,clusters=cluster)
    diff = centroids - former_centroids
    if diff.any() <0.000001:
        get_cluster_labels(clusters=cluster,x=x)
        break

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

6条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
Jackyin0720 2022-10-19 20:37
关注
K-Means算法从随机初始化簇质心开始。每次运行KMeans时，此选择都会有所不同，可能会产生不同的结果。为了得到可再现的结果，可以在KMeans中使用random_state参数，这将修复簇中心线的初始选择：

model = KMeans(n_clusters=number_of_clusters, init='k-means++', max_iter=100, n_init=100, random_state=123)
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(5条)

报告相同问题？

关注问题

1.Python从入门到精通—Python编程语言简介
2024-05-05 17:57

青花锁的博客 Python是一种高级编程语言，由Guido van Rossum于1989年底发明。Python在设计时注重代码的可读性和简洁性，因此被称为“可读性强的语言”。它是一种解释型语言，可以在多个操作系统上运行，包括Windows、Linux和...
Python简介：简洁而强大的编程语言
2023-12-07 08:16

想你依然心痛的博客 Python是一种高级、解释型、通用编程语言，以其简洁明了的语法和强大的功能而广受欢迎。它由Guido van Rossum于1989年底发明，并于1991年首次发布。Python的设计哲学强调代码的可读性和简洁性，使得它成为初学者和...
用python解决百钱买百鸡问题
2023-09-04 00:00

算法与编程之美的博客 1 问题在《算经》中有一道著名的“百钱买百鸡”的问题：鸡翁一，值钱五；鸡母一，值钱三；鸡雏三，值钱一；百钱买百鸡，则翁、母、雏各几何？2 方法创建三个变量 cock，hen，chick钱的条件：c o c k × 5 + h e n ×...
如何解决Python不支持中文路径的问题？
2024-12-20 14:33

cda2024的博客在编程的世界里，遇到问题并不罕见，但有些问题可能会让人感到格外棘手。比如，你是否曾经在使用Python处理文件...今天，我们就来深入探讨一下“如何解决Python不支持中文路径的问题”，希望能为你的编程之路扫清障碍。
python语言有什么特点?python应用领域有哪些?
2020-06-19 17:31

学术严谨的博客随着人工智能、大数据的发展，各大企业都开始抢夺市场，而python语言作为该领域的首选语言，广受大家的喜欢，现在越来越多人都想要学习python，为什么呢? python语言有什么特点? 1、简洁高效：简单大方、开发效率高...
学Python该看什么书？所有方向的精华好书推荐，20年老程序员倾囊相授
2021-07-21 02:39

退休的龙叔的博客 Python所有方向性价比最高的书籍推荐！
人工智能开发语言 python,python人工智能编程教程
2022-10-10 15:18

快乐的小肥熊的博客 Python作为人工智能首选编程语言，随着人工智能时代的到来，Python开发效率非常高，Python有非常强大的第三方库，基本上你想通过计算机实现任何功能，Python官方库里都有相应的模块进行支持，直接下载调用后，在基础...
python属于哪类型的编程语言有哪些_python是什么类型的编程语言？
2021-02-10 10:09

张北晨的博客 Python是一种计算机程序设计语言，是一种面向对象的动态、强类型脚本语言(解释型语言)。强类型：不允许不同类型相加动态类型：不使用显示数据类型声明，且确定一个变量的类型是在第一次给它赋值的时候脚本语言：一般...
【Python学习教程】Python编程基础_python编程 csdn
2024-04-27 21:47

2401_84140023的博客类型原理优点缺点编译型语言通过专门的编译器，将所有源代码一次性转换成特定平台（Windows、Linux 等）执行的机器码（以可执行文件的形式存在）...编程语言有“高低”之分，而高级语言又有很多种，比如C++JavaC#PHP。
机器人编程与python语言的区别_儿童编程和机器人编程有啥区别？
2020-12-08 19:40

weixin_39758696的博客虽然都带有“编程”二字，但少儿编程和机器人编程还是有本质区别的，有哪些不一样呢？偷懒的家长可以直接看下面这张表格：想要详细了解的话，本回答内容较长，可以点赞&收藏，方便回看！大纲先给大家献上：1、...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 10月30日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 10月22日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 10月19日

关于#python#的问题，如何解决？

python在跑k均值聚类时候的时候，每次运行结果都不一样，求帮忙瞅瞅是哪出问题了？

6条回答 默认 最新

问题事件

6条回答默认最新