qq_24949293 2019-04-30 21:03 采纳率: 50%
浏览 4901
已结题

关于经纬度数据的聚类分析思路问题

我需要用python处理数据量在10万x30天左右的经纬度/时间戳数据。数据都是出租车乘客的下车点,想分析出市区中的一些热点区域。但是目前我的分析遇到了瓶颈,因为以前没有大数据分析的经验,所以目前只是单纯的在用DBSCAN算法对单天数据进行聚类。目前聚类并没有得到很好的结果,在设置不同参数(最小距离,最小簇数量)时聚类结果的随机性也很严重。目前我的思路是缩小最小距离,对产生的无数个小簇用K-means提取聚类中心然后剔除一部分离散点,用小簇的聚类中心作为新的聚类点,二次进行DBSCAN聚类以提升聚类结果的精度。不知我的思路有没有价值。如果没有价值,有没有大佬能提供一点思路。我的聚类方法基本上就会DBSCAN,K-Means以及St-Dbscan图片说明
希望能得到大佬的提点。

  • 写回答

1条回答 默认 最新

  • threenewbee 2019-04-30 23:54
    关注

    因为你是基于地图的点的聚类,不是单纯的几何数据,所以说你可以用地名标签做有监督学习,可以考虑用自动编码器来提高效率。

    评论

报告相同问题?

悬赏问题

  • ¥30 这是哪个作者做的宝宝起名网站
  • ¥60 版本过低apk如何修改可以兼容新的安卓系统
  • ¥25 由IPR导致的DRIVER_POWER_STATE_FAILURE蓝屏
  • ¥50 有数据,怎么建立模型求影响全要素生产率的因素
  • ¥50 有数据,怎么用matlab求全要素生产率
  • ¥15 TI的insta-spin例程
  • ¥15 完成下列问题完成下列问题
  • ¥15 C#算法问题, 不知道怎么处理这个数据的转换
  • ¥15 YoloV5 第三方库的版本对照问题
  • ¥15 请完成下列相关问题!