用的Anaconda Jupyter Notebook的dbscan函数,数据量是30万左右
用了两版数据(已在dataframe里对比过,两版数据大小一致),参数均为2和MinPts=15
(1)第一版未处理过的数据成功运行出了结果
(2)第二版仅做了standardization,但每次运行内核都挂掉,查看了终端运行信息没有发现任何报错,只显示重启Kernal
问:这两版数据我能想到的区别就是
一、第二版数值是小数(小数点后5位)
二、第二版数值存在负数
所以难道是因为负数无法输入dbscan的estimator?
各位大神救救小女子吧,已经埋头苦想三天了
( ;´Д`)
(现在电脑不在手边,一会儿方便了贴代码)