密度峰值聚类的截断距离dc在数据归一化后如何取？

原始dc是数据总量的1%-2%，那么归一化之后该值该如何取

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
HEAD_L4 2021-10-15 11:08
关注
大部分好像是先计算数据点之间的距离，然后对距离进行降序排序，再取前1%~2%。但有学者指出这种方法不是最优的。

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

python kmeans聚类后如何获取到分类的数据？ kmeans python 有问必答聚类
2022-01-16 22:16

回答 2 已采纳 # 整理聚类结果 listName = dfData['地区'].tolist() # 将 dfData 的首列 '地区' 转换为 listName dictCluster
请问Python 聚类分析的数据标准化是什么意思呢？为什么要做这一步操作？？ python 数据分析
2022-01-31 20:47

回答 1 已采纳快速聚类，不需要对变量进行标准化的，但仍然推荐进行标准化。层次聚类，必须进行标准化，因为各变量的量纲会有差异。简单的说，第一列数据的单位是万元，第二列数据的单位是元，如果不做标准化第一列就会被忽
请问如何对矩阵类型的数据聚类？ python sklearn 聚类
2021-08-12 11:03

回答 4 已采纳你这个数组是三维的啊，虽然不清楚sklearn的kmeans函数具体用法，但传入的X不是矩阵形式啊，应该是二维数组吧
【数据聚类】第四章第三节：密度峰值聚类及其Python实现
2022-07-13 09:55

快乐江湖的博客 Python代码关于簇的定义尚未达成共识，每种算法有各自的定义重点...9号点处在1号点的簇中，其他有着高密度的点和其十分接近，然而10号点虽然和9号点密度相仿，但最近的高密度却属于其他簇（距离）像点27、27、28由于ppp
聚类算法/ip聚类/可视化 kmeans 算法聚类
2023-02-19 16:37

回答 9 已采纳针对日志分析可视化中使用聚类算法的问题，以下是一些思路和建议： 1.确定聚类算法：首先需要选择一种适合日志数据的聚类算法，例如k-means、层次聚类等。选择算法时需要考虑数据量、数据维度、聚类结果的
机器学习中什么是推断？和聚类、回归这些术语有什么关系？人工智能机器学习
2022-02-04 17:06

回答 1 已采纳推断是根据已知随机变量求未知随机变量条件分布的过程，例如我从一段语音推断对应的文字。预测是推断的一种，其已知变量、未知变量具有因果关系，分类、回归都属于预测问题。
矢量数据做k均值聚类可以用geoda做吗聚类
2023-04-07 11:24

回答 1 已采纳可以。Geoda 和 Matlab 在进行 K-means 聚类分析时的主要区别在于：1. 应用领域：Geoda 是专门针对地理空间数据设计的软件，具有丰富的地理数据分析功能，而 Matlab 是一个
面向地理大数据的新型密度山峰聚类算法（一）——算法描述
2019-09-23 12:05

万万VV的博客通过实现和改进在《Science》杂志上发表的一种新型快速密度山峰聚类算法[1],与现有的常用聚类方法进行分析比较，发现其优点和不足的地方，并实际应用于地理定位大数据的分析中，以快速发现位置数据中任意形状的聚类...
Kmeans聚类算法应用问题，八维数据的分类 kmeans python 有问必答聚类
2021-11-08 09:09

回答 1 已采纳分类： km = KMeans(n_clusters=4) km.fit_predict(data) 分完类之后得到了聚类中心，也就是km.cluster_centers_，你可以print出来：
关于#k-means#的问题，如何解决？(标签-聚类) kmeans 机器学习聚类
2023-04-05 00:19

回答 2 已采纳改成Label = km.fit_predict(np.asarray(imgData))试试
用seaborn.clustermap做聚类热图，怎么自定义1-相关性系数作为距离度量呢？ python 有问必答
2021-10-11 12:21

回答 1 已采纳问题搞复杂了吧，在clustermap中设置参数metric="correlation"就行了，例如 g = sns.clustermap(iris, metric="correlation")
面向流形数据的共享近邻密度峰值聚类算法
2023-12-02 21:32

宋罗世家技术屋的博客为此，本文提出面向流形数据的共享近邻密度峰值聚类(density peaks clustering based on shared nearestneighbor for manifold datasets, DPC-SNN)算法。提出了一种基于共享近邻的样本相似度定义方式，使得同一流形...
如何对聚类产生的结果簇进行进一步分析？ python
2019-05-01 20:24

回答 2 已采纳用户出行模式的问题通常不单单是找出地图上的热点区域的问题, 而是一个多维度的包括时间的聚类. 所用到的维度可能包括乘车日期, 上车时间,下车时间, 乘车站点, 类型(地铁,出租...).... 之
聚类算法代码
2022-11-21 21:58

我要毕业！！的博客【代码】聚类算法代码。
多标准优化的主动学习算法（Active learning through multi-standard optimization）——MSAL
2020-08-31 08:47

wangmin80616的博客多标准优化的主动学习算法（Active learning through multi-standard optimization）——MSAL 多标准优化的主动学习算法（Active learning through multi-standard ...主动学习在训练集中已标注数据上学习得
没有解决我的问题, 去提问

悬赏问题

¥15 安卓adb backup备份应用数据失败
¥15 eclipse运行项目时遇到的问题
¥15 关于#c##的问题：最近需要用CAT工具Trados进行一些开发
¥15 南大pa1 小游戏没有界面，并且报了如下错误，尝试过换显卡驱动，但是好像不行
¥15 没有证书，nginx怎么反向代理到只能接受https的公网网站
¥50 成都蓉城足球俱乐部小程序抢票
¥15 yolov7训练自己的数据集
¥15 esp8266与51单片机连接问题(标签-单片机|关键词-串口)（相关搜索：51单片机|单片机|测试代码）
¥15 电力市场出清matlab yalmip kkt 双层优化问题
¥30 ros小车路径规划实现不了，如何解决？(操作系统-ubuntu)

密度峰值聚类的截断距离dc在数据归一化后如何取？

1条回答 默认 最新

悬赏问题

1条回答默认最新