目前有一用电数据集(txt格式),想用kmeans实现对该时间序列的聚类。
但kmeans是针对单个数据点的聚类,而不是曲线(由1440×2的矩阵构成)。
数据集生成的是多个1440×2的矩阵。
那么如何修改参数实现?
本人使用的是matlab调试kmeans代码。
急求大佬给改进意见,或者直接扔给我matlab/python的能实现时间序列聚类的Kmeans代码,跪谢。
目前有一用电数据集(txt格式),想用kmeans实现对该时间序列的聚类。
但kmeans是针对单个数据点的聚类,而不是曲线(由1440×2的矩阵构成)。
数据集生成的是多个1440×2的矩阵。
那么如何修改参数实现?
本人使用的是matlab调试kmeans代码。
急求大佬给改进意见,或者直接扔给我matlab/python的能实现时间序列聚类的Kmeans代码,跪谢。
你实现对曲线进行聚类咯?我认为可以将曲线用一些统计量代替,比如根据曲线的平均值进行聚类。
要知道,Kmeans 如你所说,是对单一数据点的聚类。所以,与其去更改聚类算法,不弱进行**数据预处理**。因此,先想办法将你的数据(曲线)弄成一个点,在聚类吧。
(时序数据一般有联系,所以可以用一些统计量表示,比如均值。)