如何对聚类产生的结果簇进行进一步分析？

本人是数据挖掘方面的小白，最近刚开始做学校给出的数据分析项目。
语言用的是python。
我目前在做西安市经纬度地图的聚类分析并提取其中的热点区域。我用DBSCAN算法提取出了7-8个核心热点区域（最大的簇），并且用K-means锁定了它们的质心。但是聚类出来的簇很基本而且并不规则。并不符合最终聚类结果的标准。我查了一些问答发现需要对每一个聚类产生的簇进行进阶分析。但我目前并不知道从何下手。
几个可能的方向：
1.对聚类簇做回归分析，让每个簇的形状变得更规则？
2.结合聚类簇的质心，标注出相关地段最有特点的景点或建筑作为标签，然后用有监督学习？
我只想到了上面两个可能的进阶分析方法，但是我上面两个方法也不知道该用什么合适的算法来入手，希望能得到大佬们的提点。或者有更好的思路，也希望大佬能为我指明道路，谢谢！

补充：我的聚类目的是通过分析西安市区中的热点区域，结合具体时间段来分析西安市出行用户的出行模式。（经纬度数据都是用户上下车点的数据）

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
weijun05 2019-05-05 11:25
关注
用户出行模式的问题通常不单单是找出地图上的热点区域的问题, 而是一个多维度的包括时间的聚类. 所用到的维度可能包括乘车日期, 上车时间,下车时间, 乘车站点, 类型(地铁,出租...)....
之后需要对这些维度的数据进行特征提取, 比如说出行的路线轨迹/距离, 站点序列,出行时间, ... 对于路线轨迹/距离, 简单的基于euclidean distance肯定是不适用的,可以考虑使用scipy.spatial.distance.cdist(a,b, 'cityblock').
提取特征之后, 大概就可以从时间, 空间, 行程链这几个维度来对每个用户的出行周期进行量化了. 最简单的做法就是只提取出门时间, 结束时间, 出行距离, 然后按照这几个特征再进行聚类.

至于你上面提到的回归也好, 监督学习也好, 最好都是基于一定目的的特征提取之后再进行的 (而且要结合你的最终要解决的目标问题).

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

报告相同问题？

关注问题

如何对聚类结果进行分析_干货：如何对用户进行聚类分析？
2020-12-06 09:42

weixin_39724009的博客 -聚类分析(cluster analysis)是常见的数据挖掘手段，其主要假设是数据间存在相似性。而相似性是有价值的，因此可以被用于探索数据中的特性以产生价值。常见应用包括：用户分割：将用户划分到不同的组别中，并根据簇...
python医学数据分析， k-means 算法进行聚类分析
2024-09-17 01:55

通过聚类分析，可以将人群按照蛋白质摄入类型和数量的不同进行分组，从而对不同组别的人群进行进一步的研究。在车辆驾驶行为数据分析中，聚类分析同样具有重要意义。通过对车辆驾驶行为数据的分析，可以识别出不同...
python聚类分析的结果_Python之ML--聚类分析
2021-01-14 01:51

啊倩的博客 Python之ML–聚类分析使用监督学习来构建学习模型,其中训练数据都是事先已知预测结果的,即训练数据中已提供了数据的类标;在本节,我们将转而研究聚类分析,它是一个无监督学习(unsupervised learning),可以在事先不...
【项目实战】Python基于KMeans算法进行文本聚类项目实战
2022-02-14 23:20

在本项目实战中，我们将深入探讨如何利用Python和KMeans算法进行文本聚类。文本聚类是无监督学习的一种应用，旨在将相似的文本分组到一起，无需预先指定类别。这个项目涵盖了从数据获取、预处理到模型构建的全过程，...
基于二阶段聚类的车辆品牌聚类分析python源码+说明文档+数据集.zip
2024-07-28 12:38

高相关性变量的处理——对于其余数值型变量，变量数目较多且多个变量之间存在相关性，因此考虑使用因子分析对数值型变量进行降维，以减少数值型变量的数目并使变量间相互独立。第五步：数值型变量因子分析结果...
基于python的线性回归和聚类分析预测糖尿病
2024-04-26 21:13

在本项目中，我们主要探讨的是如何利用Python编程语言进行数据预处理、构建线性回归模型以及执行聚类分析，以此来预测糖尿病的发病率。这是一个典型的数据科学应用场景，结合统计学方法与机器学习技术，旨在从数据中...
聚类算法对同一个二维坐标数据集进行聚类分析
2022-03-16 18:01

本项目聚焦于四种常见的聚类算法：BIRCH（层次增量聚类）、K-Means、K-Means++以及K-Nearest Neighbors（KNN），对同一二维坐标数据集进行聚类分析。首先，BIRCH（Balanced Iterative Reducing and Clustering ...
Python 实现 K-Means 聚类算法并对鸢尾花数据集进行聚类演示
2025-08-20 09:03

在聚类分析完成后，还需要对结果进行解释，这可能涉及到对每个簇的特征进行分析，以了解不同簇代表的意义。例如，在鸢尾花数据集的聚类分析中，可能需要查看每个簇中样本的均值，以此来判断各个簇代表的鸢尾花种类。...
chapter14_python聚类分析_python_antspu3_层次化聚类_
2021-09-29 16:40

通过使用antspu3，数据科学家可以方便地对数据进行分组，揭示隐藏的模式，并为进一步的数据探索和分析提供基础。在实际操作中，理解聚类方法、选择合适的距离度量以及正确解释聚类结果都是至关重要的。
在Python中使用K-Means聚类和PCA主成分分析进行图像压缩
2020-09-17 14:03

### 在Python中使用K-Means聚类和PCA主成分分析进行图像压缩 #### 引言本文将详细介绍如何在Python环境中使用K-Means聚类算法和PCA(Principal Component Analysis，主成分分析)来进行图像压缩。这两种方法是图像...
没有解决我的问题, 去提问

如何对聚类产生的结果簇进行进一步分析？

2条回答 默认 最新

2条回答默认最新