基于POI数据的聚类，并且将聚类结果可视化在地图上

使用python读取本地csv文件，筛选大类为“旅游景点”的POI数据，进行DBSCAN聚类算法进行聚类，最后将聚类结果绘制到pyecharts的地图map上，但是最终只生成了map.html，聚类结果并没有显示到地图上。

代码如下：

import numpy as np
import matplotlib.pyplot as plt
from sklearn.datasets import make_blobs
from sklearn.preprocessing import StandardScaler
from sklearn.cluster import DBSCAN
from sklearn import metrics
import pandas as pd
from pyecharts import options as opts
from pyecharts.charts import Map

UNCLASSIFIED = 0
NOISE = -1


# 计算数据点两两之间的距离
def getDistanceMatrix(datas):
    N, D = np.shape(datas)
    dists = np.zeros([N, N])

    for i in range(N):
        for j in range(N):
            vi = datas[i, :]
            vj = datas[j, :]
            dists[i, j] = np.sqrt(np.dot((vi - vj), (vi - vj)))
    return dists


# 寻找以点cluster_id为中心，eps为半径的圆内的所有点的id
def find_points_in_eps(point_id, eps, dists):
    index = (dists[point_id] <= eps)
    return np.where(index == True)[0].tolist()


# 聚类扩展
# dists：所有数据两两之间的距离 N x N
# labs: 所有数据的标签 labs N，
# cluster_id：一个簇的标号
# eps：密度评估半径
# seeds：用来进行簇扩展的点
# min_points：半径内最少的点数
def expand_cluster(dists, labs, cluster_id, seeds, eps, min_points):
    i = 0
    while i < len(seeds):
        # 获取一个临近点
        Pn = seeds[i]
        # 如果该点被标记为NOISE 则重新标记
        if labs[Pn] == NOISE:
            labs[Pn] = cluster_id
        # 如果该点没有被标记过
        elif labs[Pn] == UNCLASSIFIED:
            # 进行标记，并计算它的临近点 new_seeds
            labs[Pn] = cluster_id
            new_seeds = find_points_in_eps(Pn, eps, dists)

            # 如果new_seeds足够长则把它加入到seed队列中
            if len(new_seeds) >= min_points:
                seeds = seeds + new_seeds

        i = i + 1


def dbscan(datas, eps, min_points):
    # 计算所有点之间的距离
    dists = getDistanceMatrix(datas)

    # 将所有点的标签初始化为UNCLASSIFIED
    n_points = datas.shape[0]
    labs = [UNCLASSIFIED] * n_points

    cluster_id = 0
    # 遍历所有点
    for point_id in range(0, n_points):
        # 如果当前点已经处理过了
        if not (labs[point_id] == UNCLASSIFIED):
            continue

        # 没有处理过则计算临近点
        seeds = find_points_in_eps(point_id, eps, dists)

        # 如果临近点数量过少则标记为NOISE
        if len(seeds) < min_points:
            labs[point_id] = NOISE
        else:
            # 否则就开启一轮簇的扩张
            cluster_id = cluster_id + 1
            # 标记当前点
            labs[point_id] = cluster_id
            expand_cluster(dists, labs, cluster_id, seeds, eps, min_points)
    return labs, cluster_id


# 绘制散点图
def draw_cluster(datas, labs, n_cluster):
    plt.cla()

    colors = [plt.cm.Spectral(each)
              for each in np.linspace(0, 1, n_cluster)]

    for i, lab in enumerate(labs):
        if lab == NOISE:
            plt.scatter(datas[i, 0], datas[i, 1], s=16., color=(0, 0, 0))
        else:
            plt.scatter(datas[i, 0], datas[i, 1], s=16., color=colors[lab - 1])
    plt.show()


if __name__ == "__main__":
    # 从CSV文件中读取数据
    data = pd.read_csv("C:/Users/86136/Desktop/大数据/昆明市POI数据.csv")  # 替换成你的CSV文件路径
    filtered_data = data[data['大类'] == '旅游景点']
    selected_columns = filtered_data[['经度', '纬度']].values

    # 数据正则化
    scaler = StandardScaler()
    selected_columns = scaler.fit_transform(selected_columns)

    # 设置DBSCAN参数
    eps = 0.1
    min_points = 8

    # 执行DBSCAN聚类
    #labels, n_clusters = dbscan(selected_columns, eps, min_points)

    # 绘制散点图
    #draw_cluster(selected_columns, labels, n_clusters)

    # 构造地图数据
    map_data = [(str(selected_columns[i][0]), str(selected_columns[i][1])) for i in range(len(selected_columns))]

    # 绘制地图
    map_chart = (
        Map()
        .add("聚类结果", selected_columns, "昆明")
        .set_series_opts(label_opts=opts.LabelOpts(is_show=False))
        .set_global_opts(
            title_opts=opts.TitleOpts(title="DBSCAN聚类结果地图"),
            visualmap_opts=opts.VisualMapOpts(),
        )
    )

    # 保存地图为HTML文件
    map_chart.render("dbscan_map.html")

csv文件如下：
[](链接: https://pan.baidu.com/s/1bHt2ajRLpJv3bxEPKR_4CA 提取码: yfzu 复制这段内容后打开百度网盘手机App，操作更方便哦)

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

报告相同问题？

关注问题

基于POI大数据可视化分析的生活配套服务研究
2025-09-01 23:39

毕设源码实验室的博客本文介绍了一个基于POI大数据的可视化分析平台，专注于生活配套服务设施的空间分析。系统整合多源POI数据，采用模块化设计，提供数据采集、清洗、存储、分析和可视化展示全流程服务。核心功能包括：多维度数据可视化...
【聚类算法】基于网格的聚类
2024-09-17 21:25

大雨淅淅的博客网格聚类算法是一种将数据空间划分为有限数量的单元，形成一个网格结构的数据结构，然后在此基础上进行聚类的方法。这种算法的主要思想是将数据空间划分为有限个单元组成的网格，每个单元代表一个区域，然后对每个...
deck.gl数据聚类：无监督学习在可视化中的应用
2025-09-06 01:55

伍辰惟的博客 deck.gl通过WebGL2硬件加速，将无监督学习算法移植到GPU端执行，实现百万级数据实时聚类可视化。本文系统讲解deck.gl中5种核心聚类算法的实现原理、性能对比与实战技巧。 ## 聚类可视化技术演进 ### 从CPU到G...
基于地图坐标临近点聚合的聚类算法研究
2023-06-29 10:26

清风ikl的博客 DBSCAN（Density-Based Spatial Clustering of ...它能够将具有足够高密度的区域划分为簇，并在空间上连接具有高密度的区域。 K-means 算法是一种常见的聚类（clustering）算法，它将数据集分成 k 个簇（cluster）。
17、地理空间映射中的时空事件可视化与点聚类质量评估
2025-10-21 03:13

backprop5master的博客针对社交媒体数据和地理空间点数据的可视化挑战，提出采用聚类技术减少数据杂乱、提升渲染效率并优化用户体验。文章介绍了采样与多种聚类方法的原理及优缺点，定义了聚类结果的质量评估指标，包括地理分布代表性、...
56、基于遗传算法的可视化扩展：优化数据可视化的新途径
2025-07-15 21:21

字节梗主的博客本文介绍了一种基于遗传算法的可视化扩展方法，旨在优化高维数据的投影和展示效果。通过改进POI（兴趣点）的选择与布局，并结合受Kruskal应力启发的评估标准，该方法能够自动选择相关且数量较少的POI集合，同时探索...
poi_027_武汉poi数据_POI_选址_源码
2021-10-04 01:15

用户可以通过Excel的内置功能或与其他编程语言（如Python的pandas库）结合，进行数据处理和可视化，以辅助决策。总的来说，这份资料提供了一个研究武汉城市格局和商业选址策略的工具，涉及了地理信息系统、大数据...
基于Python的共享单车数据可视化系统
2025-08-28 07:51

毕设源码实验室的博客系统旨在利用大数据技术和机器学习算法构建一个基于Python的共享单车数据可视化系统。该系统通过对海量共享单车使用数据的采集、处理和分析，实现多维度的数据可视化展示与深度挖掘。
上海POI数据_高德地图_火星坐标系_12个标签_630000+.zip
2021-09-07 13:13

此外，也可以通过GIS可视化工具将数据展示在地图上，以便于决策者直观理解城市状况。 7. **数据处理**：使用这些数据前，开发者需要进行数据清洗、坐标转换（火星坐标转WGS84）、数据整合等工作，确保数据准确无误...
2016年POI数据集.txt
2024-07-22 21:58

使用地理信息系统软件或Web GIS工具（如QGIS、ArcGIS等）将POI数据可视化，可以帮助直观地展示兴趣点的空间分布情况。此外，还可以结合其他数据源（如人口统计信息、交通流量数据等）进行多维度分析。 #### 数据...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 12月19日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 12月11日

基于POI数据的聚类，并且将聚类结果可视化在地图上

0条回答 默认 最新

问题事件

0条回答默认最新