python，直线聚类

下图这个是直线检测后，将所有直线延长后的结果，现在想使用聚类算法，将竖着的直线聚类为两个簇，将横着的直线也聚类为两个簇

但是使用k-means方法时，发现聚类时将本来应该分到右边一簇的直线分到了左侧，导致左侧计算合并直线时，受到了右边直线的影响。
不知道各位有什么好的解决方法。
目前查k-means方法时，发现使用的是平均值作为簇的质心，想用中位数尝试一下，找到了k-median方法，但是不知道代码怎么改

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

6条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
专家-赤兔[在线] 优质创作者: 编程框架技术领域 2023-12-26 22:26
关注
引自微信小程序：皆我百晓生：

为了实现直线聚类，可以使用DBSCAN（Density-Based Spatial Clustering of Applications with Noise）算法。DBSCAN是一种基于密度的聚类算法，可以将数据点分为高密度区域（簇）和低密度区域（噪声）。

以下是使用Python的scikit-learn库实现直线聚类的示例代码：

import numpy as np from sklearn.cluster import DBSCAN from sklearn.preprocessing import StandardScaler # 原始直线数据 lines = [0, 50, 100, 150, 200, 250, 300, 350, 0, 50, 100, 150, 200] # 将直线数据重塑为二维数组 lines = np.array(lines).reshape(-1, 1) # 标准化数据 scaler = StandardScaler() lines = scaler.fit_transform(lines) # 创建DBSCAN对象 dbscan = DBSCAN(eps=0.5, min_samples=2) # 进行聚类 clusters = dbscan.fit_predict(lines) # 输出每个直线所属的簇 print('Cluster labels:') for line, cluster in zip(lines, clusters): print(f'{line[0]:>5.1f} -> Cluster {cluster}');

这里使用了StandardScaler对直线数据进行标准化，以确保不同直线之间具有相似的尺度。然后使用DBSCAN进行聚类，其中eps参数是邻域的半径，min_samples参数是邻域中要包含的最小样本数。根据实际情况，你可以根据需求调整这两个参数的值。

运行以上代码后，将得到每个直线所属的聚类簇的标签。

注意：以上代码假设直线数据按照顺序排列，并且已经处理了一些异常点。如果数据存在噪声或者直线顺序混乱，可能需要先进行预处理或者调整算法参数以获得最佳结果。
解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

python直线聚类_Python用K-means聚类算法进行客户分群的实现
2021-01-14 14:18

weixin_39525313的博客 for n in range(1, 11): # 构造聚类器 km2 = (KMeans(n_clusters=n, init='k-means++', n_init=10, max_iter=300, tol=0.0001, random_state=111, algorithm='elkan')) # 用训练数据拟合聚类器模型 km2.fit(df_ai_...
【Python学习】人工智能-无监督学习—聚类
2024-11-13 04:30

墨夶的博客 # 创建 K-Means 模型通过本文，你应该已经学会了如何使用 Python 进行聚类分析，包括基础知识、常用算法、数据预处理、模型训练和评估等。聚类是一个不断发展的领域，希望本文能为你提供一个良好的起点，助你在无...
AI人工智能领域聚类算法全解析
2025-07-13 23:47

AGI大模型与大数据研究院的博客在AI的世界里，聚类算法是连接数据与洞察的“无监督魔法师”——它无需预先标注的标签，仅通过数据内在的相似性，就能将海量信息自动划分成有意义的群组。本文将从聚类的核心概念出发，逐层解析K-means、DBSCAN、...
人工智能实验K聚类算法实验报告.docx
2021-05-25 13:20

《人工智能实验：K聚类算法实现与理解》 K聚类算法是数据挖掘和机器学习领域中常用的一种无监督学习方法，它通过寻找数据的内在结构，将数据集中的对象分成若干类别，使得同一类别的对象具有较高的相似性，而不同...
人工智能经典算法Python实现.zip
2024-04-25 22:46

《人工智能经典算法Python实现》是针对AI领域中常用算法的Python编程实践，涵盖了从基础到高级的各种算法。在人工智能领域，Python语言凭借其简洁的语法和丰富的库支持，已成为首选的编程工具。本资料包主要关注如何...
深入了解AI人工智能领域的聚类方法
2025-04-03 00:10

光子AI的博客聚类方法是人工智能和数据挖掘领域中的重要技术，其目的在于将数据集中相似的数据对象划分到同一个类别中，使得同一类内的数据对象具有较高的相似性，而不同类之间的数据对象具有较大的差异性。本文的范围涵盖了常见...
Python使用系统聚类方法进行数据分类案例一则
2017-12-11 15:02

dongfuguo的博客基础知识（106页） Python使用K-means聚类算法进行分类案例一则 KNN分类算法原理与Python+sklearn实现根据身高和体重对体型分类 Python+sklearn使用线性回归算法预测儿童身高使用线性回归拟合平面最佳直线及预测之...
Python学习笔记——聚类算法：K-means、凝聚层次聚类、基于密度聚类
2024-04-23 21:41

秦子淮的博客在单链接聚类中，两个聚类之间的链接距离是两个聚类中最接近的两个点的距离。在方阵中，行和列都代表城市，对角线上的元素是城市与自己之间的距离，非对角线上的元素是城市之间的距离。‘average’（平均链接）：...
【Python/Pytorch 】-- K-means聚类算法
2024-06-21 18:08

电科_银尘的博客时间演变聚类算法：将时间演变聚类算法用在去噪上，基本思想是，具有相似信号演化的体素具有相似的模型参数值，并且由机器学习决定的集群数量远远小于体素的数量。因此，对一个聚类进行平均可以大大提高聚类级逆解的...
Python人工智能——向量机，聚类
2023-05-05 21:04

海是倒过来的天long的博客简单：线性，直线或平面，分割超平面。基于核函数的升维变换通过名为核函数的特征变换，增加新的特征，使得低维度空间中的线性不可分问题变为高维度空间中的线性可分问题。线性核函数：linear，不通过核函数...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已结题（查看结题原因） 12月27日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 12月26日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 12月26日

python，直线聚类

6条回答 默认 最新

问题事件

6条回答默认最新