我需要用python处理数据量在10万x30天左右的经纬度/时间戳数据。数据都是出租车乘客的下车点,想分析出市区中的一些热点区域。但是目前我的分析遇到了瓶颈,因为以前没有大数据分析的经验,所以目前只是单纯的在用DBSCAN算法对单天数据进行聚类。目前聚类并没有得到很好的结果,在设置不同参数(最小距离,最小簇数量)时聚类结果的随机性也很严重。目前我的思路是缩小最小距离,对产生的无数个小簇用K-means提取聚类中心然后剔除一部分离散点,用小簇的聚类中心作为新的聚类点,二次进行DBSCAN聚类以提升聚类结果的精度。不知我的思路有没有价值。如果没有价值,有没有大佬能提供一点思路。我的聚类方法基本上就会DBSCAN,K-Means以及St-Dbscan
希望能得到大佬的提点。
关于经纬度数据的聚类分析思路问题
- 写回答
- 好问题 0 提建议
- 追加酬金
- 关注问题
- 邀请回答
-
1条回答 默认 最新
- threenewbee 2019-04-30 23:54关注
因为你是基于地图的点的聚类,不是单纯的几何数据,所以说你可以用地名标签做有监督学习,可以考虑用自动编码器来提高效率。
解决 无用评论 打赏 举报
悬赏问题
- ¥30 这是哪个作者做的宝宝起名网站
- ¥60 版本过低apk如何修改可以兼容新的安卓系统
- ¥25 由IPR导致的DRIVER_POWER_STATE_FAILURE蓝屏
- ¥50 有数据,怎么建立模型求影响全要素生产率的因素
- ¥50 有数据,怎么用matlab求全要素生产率
- ¥15 TI的insta-spin例程
- ¥15 完成下列问题完成下列问题
- ¥15 C#算法问题, 不知道怎么处理这个数据的转换
- ¥15 YoloV5 第三方库的版本对照问题
- ¥15 请完成下列相关问题!