小弟我是做轨迹模式挖掘的,现在有200多万个轨迹点需要聚类,查了很多资料,当数据量规模很大的时候,感觉birch算法比较合适。第一,我不用确定簇的个数,第二轨迹点只有二维特征(即经纬度)。
但是,在运行代码的时候,出现了内存错误,但是我可以百分百的肯定内存并没有爆炸(因为我一直守着电脑,内存球一直在百分之50左右),然后我又尝试用部分数据,就6万个点,还是报一样的错误。
在网上也查不到类似的问题,难道我是第一个遇到的?
上面是调用聚类算法代码部分,下面是错误
小弟我是做轨迹模式挖掘的,现在有200多万个轨迹点需要聚类,查了很多资料,当数据量规模很大的时候,感觉birch算法比较合适。第一,我不用确定簇的个数,第二轨迹点只有二维特征(即经纬度)。
但是,在运行代码的时候,出现了内存错误,但是我可以百分百的肯定内存并没有爆炸(因为我一直守着电脑,内存球一直在百分之50左右),然后我又尝试用部分数据,就6万个点,还是报一样的错误。
在网上也查不到类似的问题,难道我是第一个遇到的?
上面是调用聚类算法代码部分,下面是错误