qq_24949293
qq_24949293
2019-04-30 21:03

关于经纬度数据的聚类分析思路问题

80
  • python

我需要用python处理数据量在10万x30天左右的经纬度/时间戳数据。数据都是出租车乘客的下车点,想分析出市区中的一些热点区域。但是目前我的分析遇到了瓶颈,因为以前没有大数据分析的经验,所以目前只是单纯的在用DBSCAN算法对单天数据进行聚类。目前聚类并没有得到很好的结果,在设置不同参数(最小距离,最小簇数量)时聚类结果的随机性也很严重。目前我的思路是缩小最小距离,对产生的无数个小簇用K-means提取聚类中心然后剔除一部分离散点,用小簇的聚类中心作为新的聚类点,二次进行DBSCAN聚类以提升聚类结果的精度。不知我的思路有没有价值。如果没有价值,有没有大佬能提供一点思路。我的聚类方法基本上就会DBSCAN,K-Means以及St-Dbscan图片说明
希望能得到大佬的提点。

  • 点赞
  • 回答
  • 收藏
  • 复制链接分享

1条回答