如何对聚类产生的结果簇进行进一步分析？

本人是数据挖掘方面的小白，最近刚开始做学校给出的数据分析项目。
语言用的是python。
我目前在做西安市经纬度地图的聚类分析并提取其中的热点区域。我用DBSCAN算法提取出了7-8个核心热点区域（最大的簇），并且用K-means锁定了它们的质心。但是聚类出来的簇很基本而且并不规则。并不符合最终聚类结果的标准。我查了一些问答发现需要对每一个聚类产生的簇进行进阶分析。但我目前并不知道从何下手。
几个可能的方向：
1.对聚类簇做回归分析，让每个簇的形状变得更规则？
2.结合聚类簇的质心，标注出相关地段最有特点的景点或建筑作为标签，然后用有监督学习？
我只想到了上面两个可能的进阶分析方法，但是我上面两个方法也不知道该用什么合适的算法来入手，希望能得到大佬们的提点。或者有更好的思路，也希望大佬能为我指明道路，谢谢！

补充：我的聚类目的是通过分析西安市区中的热点区域，结合具体时间段来分析西安市出行用户的出行模式。（经纬度数据都是用户上下车点的数据）

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
weijun05 2019-05-05 11:25
关注
用户出行模式的问题通常不单单是找出地图上的热点区域的问题, 而是一个多维度的包括时间的聚类. 所用到的维度可能包括乘车日期, 上车时间,下车时间, 乘车站点, 类型(地铁,出租...)....
之后需要对这些维度的数据进行特征提取, 比如说出行的路线轨迹/距离, 站点序列,出行时间, ... 对于路线轨迹/距离, 简单的基于euclidean distance肯定是不适用的,可以考虑使用scipy.spatial.distance.cdist(a,b, 'cityblock').
提取特征之后, 大概就可以从时间, 空间, 行程链这几个维度来对每个用户的出行周期进行量化了. 最简单的做法就是只提取出门时间, 结束时间, 出行距离, 然后按照这几个特征再进行聚类.

至于你上面提到的回归也好, 监督学习也好, 最好都是基于一定目的的特征提取之后再进行的 (而且要结合你的最终要解决的目标问题).

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

报告相同问题？

关注问题

如何对聚类产生的结果簇进行进一步分析？ python
2019-05-01 20:24

回答 2 已采纳用户出行模式的问题通常不单单是找出地图上的热点区域的问题, 而是一个多维度的包括时间的聚类. 所用到的维度可能包括乘车日期, 上车时间,下车时间, 乘车站点, 类型(地铁,出租...).... 之
R语言，用系统聚类法对数据进行聚类分析，并与Kmeans聚类结果进行比较 r语言有问必答
2021-10-05 19:11

回答 2 已采纳你好，我是有问必答小助手，非常抱歉，本次您提出的有问必答问题，技术专家团超时未为您做出解答本次提问扣除的有问必答次数，将会以问答VIP体验卡（1次有问必答机会、商城购买实体图书享受95折优惠）的形式为
python kmeans聚类后如何获取到分类的数据？ kmeans python 有问必答聚类
2022-01-16 22:16

回答 2 已采纳 # 整理聚类结果 listName = dfData['地区'].tolist() # 将 dfData 的首列 '地区' 转换为 listName dictCluster
python聚类分析的结果_Python之ML--聚类分析
2021-01-14 01:51

啊倩的博客 Python之ML–聚类分析使用监督学习来构建学习模型,其中训练数据都是事先已知预测结果的,即训练数据中已提供了数据的类标;在本节,我们将转而研究聚类分析,它是一个无监督学习(unsupervised learning),可以在事先不...
想用肘关节法看图片最优聚类输入维度有问题怎么解决？ python
2023-02-21 13:33

回答 2 已采纳该回答引用GPTᴼᴾᴱᴺᴬᴵ 从您提供的代码看，图片已经被读入，reshape 成为 (n_samples, n_features) 的二维数组 Z，再转化为一维数组 whw_df。但是在这里，一维数
DBSCAN聚类结果分析 python
2021-03-23 20:54

回答 2 已采纳你把min_samples改小点试下，以及测试下不同的eps设定，可以理解内部结构和合理的参数设定。 min_samples越大，越多的点容易标记为噪声。 eps越大，越多的点容易被包含在一个簇中
python聚类问题 python 聚类
2022-12-08 19:05

回答 1 已采纳你的数据中有非数值型的字符串型数据，你检查一下新使用的数据
Python数据分析案例09——航空公司客户聚类分析
2022-09-27 10:24

阡之尘埃的博客 Python航空公司客户聚类分析案例，K均值聚类，FRM模型，客户分层制定策略。
请问如何对矩阵类型的数据聚类？ python sklearn 聚类
2021-08-12 11:03

回答 4 已采纳你这个数组是三维的啊，虽然不清楚sklearn的kmeans函数具体用法，但传入的X不是矩阵形式啊，应该是二维数组吧
请问Python 聚类分析的数据标准化是什么意思呢？为什么要做这一步操作？？ python 数据分析
2022-01-31 20:47

回答 1 已采纳快速聚类，不需要对变量进行标准化的，但仍然推荐进行标准化。层次聚类，必须进行标准化，因为各变量的量纲会有差异。简单的说，第一列数据的单位是万元，第二列数据的单位是元，如果不做标准化第一列就会被忽
运用kmeans 算法对数据进行聚类 python
2022-05-05 10:03

回答 1 已采纳可以参考https://blog.csdn.net/BF02jgtRS00XKtCx/article/details/89037409
k-means聚类算法学习笔记（案例分析、python代码，结果可视化）
2023-02-14 12:11

漩涡脆波波的博客预先指定初始聚类数以及个初始聚类中心，按照样本之间的距离大小，把样本集划分为个簇根据数据对象与聚类中心之间的相似度，不断更新聚类中心的位置，不断降低类簇的误差平方和（Sum of Squared Error，SSE），当SSE...
Python文本聚类分析实例（24.03.13更新）
2024-03-09 14:12

XIAO_LU@RUC的博客文本聚类分析实战（含代码）
聚类分析-K-means、层次聚类、DBSCAN、簇评估
2023-03-03 15:36

norah2的博客介绍了聚类分析的基本概念、K-means聚类、二分K均值聚类、层次聚类、DBSCAN聚类、簇评估等内容。在必要处对各个算法的算法步骤、公式、优缺点、简单示例、时间复杂性、空间复杂性做了描述。其中还归纳了聚类类型、簇...
python数据分析：聚类分析（cluster analysis）
2018-11-30 16:43

泛泛之素的博客聚类分析或聚类是对一组对象进行分组的任务，使得同一组（称为聚类）中的对象（在某种意义上）与其他组（聚类）中的对象更相似（在某种意义上）。它是探索性数据挖掘的主要任务，也是统计数据分析的常用技术，用于...
没有解决我的问题, 去提问

悬赏问题

¥50 导入文件到网吧的电脑并且在重启之后不会被恢复
¥15 （希望可以解决问题）ma和mb文件无法正常打开，打开后是空白，但是有正常内存占用，但可以在打开Maya应用程序后打开场景ma和mb格式。
¥20 ML307A在使用AT命令连接EMQX平台的MQTT时被拒绝
¥20 腾讯企业邮箱邮件可以恢复么
¥15 有人知道怎么将自己的迁移策略布到edgecloudsim上使用吗？
¥15 错误 LNK2001 无法解析的外部符号
¥50 安装pyaudiokits失败
¥15 计组这些题应该咋做呀
¥60 更换迈创SOL6M4AE卡的时候，驱动要重新装才能使用，怎么解决？
¥15 让node服务器有自动加载文件的功能