有一个K_means++算法的程序看不懂，希望可以给讲解一下

clear
clc

fg_load=csvread('fg-load.csv');

data1=[];
data=[];

%%对风能进行归一化处理%%
[f_shuju,f_shujus]=mapminmax(fg_load(:,2)',0,1);

fg_load(:,2)=f_shuju';

for i=1:8760
data1=[data1 fg_load(i,:)];
end
clear i;

for i=1:365
data(i,:)=data1(1,i*72-71:i*72);%%data为365*72

end

N=4; %%k数目
[m n]=size(data); %m是数据个数，n是数据维数

ma=zeros(n); %每一维最大的数

mi=zeros(n); %每一维最小的数
u=zeros(N,n); %随机初始化，最终迭代到每一类的中心位置

%%k-means++算法确定初始聚类%%

u(1,:)=data(round(rand(1)*m),:);

dis=inf(m,N);

for i=2:N
for j=1:m
dis(j,i-1)=norm(data(j,:)-u(i-1,:));

diss(j)=min(dis(j,:));

end
rand_diss=rand(1)*sum(diss);
for k=1:m
rand_diss=rand_diss-diss(k);
if rand_diss<=0
u(i,:)=data(k,:);
break;
end
end

end

    jj=0;
while 1
    jj=jj+1
    pre_u=u;            %上一次求得的中心位置
    for i=1:N
        tmp{i}=[];      % 公式一中的x(i)-uj,为公式一实现做准备
        for j=1:m
            tmp{i}=[tmp{i};data(j,:)-u(i,:)];
        end
    end

    quan=zeros(m,N);
    for i=1:m        %公式一的实现
        c=[];
        for j=1:N
            c=[c norm(tmp{j}(i,:))];
        end
        [junk index]=min(c);
        quan(i,index)=norm(tmp{index}(i,:));           
    end

    for i=1:m
        for j=1:N
            if quan(i,j)>0
                quan(i,j)=1;
            end
        end
    end


    for i=1:N            %公式二的实现
       for j=1:n
            u(i,j)=sum(quan(:,i).*data(:,j))/sum(quan(:,i));
       end           
    end

    if norm(pre_u-u)<0.1  %不断迭代直到位置不再变化
        break;
    end

% if jj>100
% break;
% end
end

re=[];
for i=1:m
    tmp=[];
    for j=1:N
        tmp=[tmp norm(data(i,:)-u(j,:))];
    end
    [junk index]=min(tmp);
    re=[re;data(i,:) index];
end


%%反归一化处理%%
for i=1:24
    re(:,i*3-1)=mapminmax('reverse',re(:,i*3-1)',f_shujus)';
    u(:,i*3-1)=mapminmax('reverse',u(:,i*3-1)',f_shujus)';%%聚类结果
end

% re1=re(:,1:72)';
% re2=re(:,73)';
%

% [Sw,Sb] = scatter_mat(re1,re2);
%

% PFS=(trace(Sb)/(N-1))/(trace(Sw)/(m-N))

%

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
埋埋埋 2018-04-24 11:37
关注
K-means 思想很简单的比如你分4类最开始随机选4个点作为4个类的中心点然后计算其他所有点到这点的距离(一般取欧氏距离,二维数据就是两点的直线距离) 到哪个中心点最近就分为哪个类循环了所有点后每个类别都会有很多点
然后再平均一下每个类别的点作为中心点再循环上面的步骤不停的迭代最后没什么变化就停止下来。
直接解释代码不知道怎么解释，可以根据这个思想，逐行看代码每一步是在对数据做什么事情，就明白了
而且k-means结果和最初的随机中心点有关系一般matlab直接调用函数实现即可，matlab对初始的中心点选择是做了处理的。
希望能帮到你，手打的很累，可以参考下面的文章
https://blog.csdn.net/google19890102/article/details/26149927

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

求一个比较困难的数据结构的算法难题的具体怎么实现数据结构
2018-11-22 06:55

回答 1 已采纳 https://blog.csdn.net/jc514984625/article/details/71248483?utm_source=blogxgwz2
想问一下这段代码具体每一句是什么意思呀（有关Matlab K means算法的） kmeans matlab
2022-08-09 14:55

回答 2 已采纳没用过matlab但是用过仿matlab的matplot说一下有错的地方见谅这句是处理数据返回kmeans聚类后的数据（就是图里的三团），只有这一句是和聚类运算直接相关后面都是画图代码这三个plo
一个用C语言的数据结构算法的选择问题？谁知道算法
2018-11-16 04:52

回答 1 已采纳 https://blog.csdn.net/u011815404/article/details/85050767
原创 | 一文读懂K均值（K-Means）聚类算法
2022-10-17 17:02

数据派THU的博客本文约5800字，建议阅读10+分钟本文为你介绍经典的K-Means聚类算法。概述众所周知，机器学习算法可分为监督学习(Supervised learning)和无监督学习(Unsupervised learning)。监督学习常用于分类和预测。是让计算机去...
一个有关排课算法的问题，具体的程序的要求看里面，求各位的帮忙算法
2018-12-10 06:08

回答 1 已采纳 https://blog.csdn.net/jiayizhenzhenyijia/article/details/82389227
利用K-means算法求簇中心和轮廓系数 python
2022-12-14 21:08

回答 1 已采纳如果只是输入轮廓系数的话，就不要用plt，直接还是display就可以了
一个收支平衡的计算的算法怎么使用数据结构和C语言的方式实现的呢？ erlang golang r语言
2019-01-11 20:24

回答 1 已采纳 https://blog.csdn.net/i1020/article/details/53469317
明翰数据结构与算法笔记V0.8（持续更新）
2023-02-27 13:13

十七号城市的博客数据结构 + 算法 = 程序。无论从事前端还是后端，无论使用什么编程语言，只要想进大厂，都绕不开考核数据结构与算法。本文中的代码均用Java编写，当然，也可以使用其他语言来实现。
求问数据结构方面的高手大手来看看这个问题的算法？
2018-12-04 06:24

回答 1 已采纳 https://www.cnblogs.com/yeshadow937/p/3927404.html
R语言stat_compare_means()函数显著性如何显示小数点后三位？ r语言
2022-04-29 02:22

回答 1 已采纳 https://www.thinbug.com/q/56068860https://www.freesion.com/article/6454464986/
图的遍历+节点访问概率计算，一个数据结构怎么使用C语言实现 erlang golang r语言
2019-01-06 00:53

回答 1 已采纳 https://blog.csdn.net/song_hai_lei/article/details/88400512
打破认知：程序设计=算法+数据结构?
2019-01-07 08:22

六六子大顺1的博客大家好，我是陈旸，也是极客时间《数据分析实战 45 讲》专栏作者。...\n很多写程序的人都听说过一个公式：程序设计=算法+数据结构，我也相信很多人认为算法是编程里的基础。\n在我看来，这个公式应该...
一个坐标位置相关的计算算法问题，用C语言算法
2018-11-22 08:34

回答 1 已采纳 https://blog.csdn.net/zwj1452267376/article/details/50359475
【模式识别与人工智能】【实验报告合集】Bayes + Fisher + PCA + Decision Tree + KNN + K-Means + SVM
2022-07-21 23:19

舞果sight的博客一共七个实验，每一个实验报告均包括实验目的、实验原理、实验内容、实验结果分析（源代码后有解释、实验结果的规律有说明和总结、变换参数得到何种规律等）。模式识别已经成为当代高科技研究的重要领域之一，它已...
这10本Python与算法书，你绝对值得拥有！
2021-10-24 21:40

算法channel的博客你好，我是zhenguo1024 程序员节，感谢图灵出版社对Python与算法社区的支持，为大家提供了下面Python与算法图书的最大优惠，大家根据各自情况学习！算法书单1.算法（第4版）...
一文读懂K-Means原理与Python实现
2022-06-20 18:32

GISer Liu的博客在本文中，你将学习到K-means算法的数学原理，作者会以尼日利亚音乐数据集为案例。带你了解了如何通过可视化的方式发现数据中潜在的特征。最后对训练好的K-means模型进行评估。
没有解决我的问题, 去提问

悬赏问题

¥15 drone 推送镜像时候 purge: true 推送完毕后没有删除对应的镜像,手动拷贝到服务器执行结果正确在样才能让指令自动执行成功删除对应镜像，如何解决？
¥15 求daily translation（DT）偏差订正方法的代码
¥15 js调用html页面需要隐藏某个按钮
¥15 ads仿真结果在圆图上是怎么读数的
¥20 Cotex M3的调试和程序执行方式是什么样的？
¥20 java项目连接sqlserver时报ssl相关错误
¥15 一道python难题3
¥15 牛顿斯科特系数表表示
¥15 arduino 步进电机
¥20 程序进入HardFault_Handler