SOM与k-means两阶段聚类算法

我想问一下为什么有的论文或教程里说som的初始神经元个数由经验公式x=5*sqrt(N)确定，N为样本数量，然后得到聚类中心将其作为k-means的初始聚类中心，k-means的聚类数还是由内部指标确定。
有的教程说som不需要给定聚类数，会自动聚类并生成聚类数和聚类中心，然后将其输入到k-means中去，但是神经元的个数不就等于聚类数目吗，那他们怎么确定的神经元个数。

就比如，我这有544个样本，按经验公式计算是117个神经元，是以117个神经元直接去som聚类得到117个聚类中心，内部指标确定k-means最佳聚类数9,然后将聚类中心和聚类数9输入到k-means中。还是我直接就将神经元个数设置的小一些，比如说9，再得到聚类中心和聚类数输入到k-means中。
哪一种方法是正确的还是两种方法都可以

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
CSDN-Ada助手 CSDN-AI 官方账号 2023-12-02 04:05
关注
【以下回答由 GPT 生成】

问题分析

这个问题涉及到使用SOM和k-means两阶段聚类算法时，初始神经元个数、聚类数及聚类中心的确定方法。其中，有的教程提到了使用经验公式x=5*sqrt(N)来确定SOM的初始神经元个数，并将这些神经元作为k-means的初始聚类中心；而另一些教程则提到SOM具有自动聚类能力，不需要给定聚类数。询问哪种方法是正确的，或者两种方法都可行。

解决方案

在处理这个问题之前，我们需要先理解SOM和k-means聚类算法的基本原理。

SOM（Self-Organizing Map）是一种无监督学习算法，用于将多维输入样本映射到一个低维的网格结构（通常是二维结构）上，并保持样本之间的拓扑关系。SOM使用神经元组成的模型进行学习和训练，并通过自组织的方式不断调整神经元之间的连接权重，从而使得相似的输入样本在模型中邻近。在训练结束后，SOM可用于聚类、数据可视化等任务。在SOM模型训练过程中，样本数量和神经元个数是两个独立的参数。

k-means是一种常用的聚类算法，其目标是将样本划分为k个不重叠的簇，从而使得同一簇内的样本之间的距离尽量小，不同簇之间的样本之间的距离尽量大。k-means算法的核心思想是通过不断迭代地更新聚类中心来达到最优目标。

回到问题的核心，经验公式x=5*sqrt(N)是一种经验性的推荐，其目的是根据样本数量N来确定SOM的初始神经元个数。这个公式的具体来源和调整可以根据实际任务和经验来进行。然后，使用这些神经元作为k-means的初始聚类中心是一种合理的做法，因为SOM的训练过程会使得神经元分布在输入空间中，可以作为初始聚类中心来提供一定的初始聚类提议。但是，需要注意的是，神经元个数并不等于聚类数目。SOM的训练过程会形成一种网格结构，神经元之间的拓扑关系不一定与聚类的划分一一对应。

另一方面，针对SOM具有自动聚类能力的说法，这是因为SOM模型的训练过程会使得不同输入样本在模型中邻近，相似的样本会聚集在相邻的区域，从而实现了聚类的效果。然而，聚类数目并不是SOM模型中默认的参数，需要通过其他方法来确定。

因此，综合以上分析，可以得出以下解决方案：

在使用SOM和k-means两阶段聚类算法时，可以通过经验公式或根据实际任务和经验来确定SOM的初始神经元个数。具体选择何种方法需要根据实际情况来决定。

可以使用SOM训练后得到的神经元作为k-means的初始聚类中心，这样可以提供一定的初始聚类提议。但是，需要注意神经元个数并不等于聚类数目。

聚类数目的确定可以通过内部指标、外部指标、经验法等方法来选择。可以根据实际任务中所需的聚类效果和性能来进行调整和判断。

综上所述，可以根据实际任务和经验选择合适的方法和参数，来进行SOM和k-means两阶段聚类算法的应用。

希望以上解决方案能够给您带来帮助，如果还有任何疑问，请随时追问。

【相关推荐】

这篇博客: 机器学习《西瓜书》9.4解答——k-means算法：编程实现k均值算法，设置三组不同的k值、三组不同初始中心点，在西瓜数据集4.0上进行实验比较，并讨论什么样的初始中心有助于得到好结果。中的 1.运行结果：（注：图中方块标注的点为随机选取的初始样本点） 部分也许能够解决你的问题。

如果你已经解决了该问题, 非常希望你能够分享一下解决方案, 写成博客, 将相关链接放在评论区, 以帮助更多的人 ^-^
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

SOM K-means两阶段聚类算法及其应用.docx
2022-10-29 07:06

总结来说，SOM+K-means两阶段聚类算法结合了SOM的自组织特性和K-means的精确性，解决了单一算法的局限性，提高了聚类的准确性和稳定性。这种算法在处理复杂数据集时，特别是在需要自动发现类别数量和需要精确聚类...
（理论+代码）K-Means与DBSCAN聚类算法
2021-09-05 08:33

果子当夜宵的博客 Means2.1 基本步骤与流程2.2 代码实现2.2.1 手写python代码实现2.2.2 算法优化2.2.2.1 多次随机初始化2.2.2.2 使用肘部法则确定k2.2.3 sklean中的kmeans2.2.3.1 肘部法则优化k2.2.3.2 轮廓系数2.2.4 MiniBatchKMeans...
28、SOM++：结合自组织映射与K-Means++的高效聚类算法
2025-07-16 06:39

garlic的博客本文介绍了一种新的高效聚类算法SOM++，结合了自组织映射（SOM）和K-Means++的优势。通过K-Means++确定初始权重值，并利用顺序分配算法优化SOM的训练过程，显著提升了聚类的效率、稳定性和准确性。实验结果表明，SOM...
k-means及Isodata 聚类算法的实现
2015-02-14 16:40

本项目关注的是两种常见的聚类算法：k-means和Isodata，它们都是寻找数据分组的算法，但各自具有不同的工作原理和优缺点。 **k-means算法** 是一种迭代的划分式聚类方法。它的工作流程如下： 1. **初始化**：选择k...
k-means聚类算法及其优化
2021-05-14 20:26

lymboy的博客 k-means聚类算法及其优化在机器学习中有这样一种场景，需要对已知数据按照一定的关系归到不同的类别中（无监督） k-means是比较流行的聚类方法其基本算法流程如下：随机设置K个特征空间内的点作为初始的聚类中心...
【数据分析学习笔记day19】聚类模型 -- K-Means介绍+聚类模型+K-Means+ K-Means算法 +算法思想+ 算法描述+优缺点
2020-01-25 21:19

汪雯琦的博客文章目录聚类模型：K-MeansK-Means算法算法思想：算法描述：优缺点：聚类模型：K-Means 聚类（clustering）属于无监督学习（unsupervised learning）无类别标记在线 demo：http://syskall.com/kmeans.js K-...
论文研究-一种基于SOM和Kmeans的文档聚类算法.pdf
2019-07-22 19:31

提出了一种把自组织特征映射SOM和Kmeans算法结合的聚类组合算法。先用SOM对文档聚类，然后以SOM的输出权值初始化Kmeans的聚类中心，再用Kmeans算法对文档聚类。实验结果表明，该聚类组合算法能改进文档聚类的...
机器学习（五）聚类算法（k-means，）
2022-09-17 11:24

老衲要学习的博客 聚类算法介绍
sommatlab代码-K-means-Clustering:Matlab中的K均值聚类算法
2021-05-26 13:20

Matlab中的K均值聚类算法在本节中，目的是在Matlab中使用聚类算法，并发现自组织图（SOM）神经网络如何将虹膜花朵拓扑分类成类，从而提供对花朵类型的深入了解和有用的工具进行进一步分析。自组织图神经网络可以将...
18、数据聚类：k-means、SOM算法及应用
2025-08-31 10:28

prometheus5watch的博客本文详细介绍了两种常用的数据聚类算法——k-means和自组织映射（SOM）的基本原理、实现步骤及其应用场景。k-means是一种简单高效的聚类方法，适用于已知聚类数量的情况，而SOM则无需预先指定聚类数量，能够将高维...
数据挖掘--“聚类”详解、K-means、K-平均值算法、K均值算法
2020-07-02 18:26

中国-杨建业的博客一. 什么是聚类二.... 三. 聚类算法有哪些 ...随着科技的发展，人们将数学工具引入分类学，聚类算法便被细化归入数值分类学领域。后来，信息技术快速发展，新数据的出现呈井喷趋势，其结构的复杂性和内容的多..
k均值聚类算法考试例题_K-means聚类算法试题.ppt
2020-12-19 00:32

weixin_39566593的博客聚类——K-means算法聚类 聚类算法 K-means聚类算法 聚类的评价聚类分析是一种重要的人类行为，早在孩提时代，一个人就通过不断改进下意识中的聚类模式来学会如何区分猫狗、动物植物。聚类背景什么是聚类分析 ...
算法模型——K-Means聚类
2020-12-22 18:10

森谷蘑的博客 K-Means聚类一般于根据群体的某些标签值或某些属性，对群体进行分组。 1. 聚类与分类聚类与分类最大的区别就是，聚类就是在未知分类规则的情况下对样本集进行分群，分类就是在特征空间中用已知的规则对样本进行判别...
12、启发式聚类算法：k-means及其变体详解
2025-09-01 08:45

HH234的博客本文详细介绍了启发式聚类算法，特别是k-means算法及其多种变体，包括k-means++、全局k-means、k-中位数、k-中心点、模糊c-均值和基于混合模型的聚类方法。文章还探讨了不同算法的适用场景，并总结了它们在实际数据...
自适应聚类分析算法-基于轮廓系数的自适应寻优
2025-03-11 09:27

本资源包精心打造了K-means、自组织映射(SOM)以及SOM-K-means混合聚类算法的Python实现，旨在帮助用户轻松解决聚类分析中的难题。代码的核心优势在于其智能化的聚类数量选择机制：它利用轮廓系数作为聚类效果的评价...
聚类专题-算法原理、算法优化、算法进阶
2024-08-18 23:23

聚类算法原理：介绍了聚类算法的基本概念，包括粗聚类和细聚类，以及聚类算法与分类算法的区别。 K-Means聚类：详细讨论了K-Means算法，包括算法流程、优缺点、SSE（误差平方和）以及K值的确定方法，如肘部法、轮廓...
数据分享|R语言改进的K-MEANS(K-均值)聚类算法分析股票盈利能力和可视化
2023-05-16 14:16

拓端研究室TRL的博客相关视频人们在投资时总期望以最小的风险获取最大的利益，面对庞大的股票市场和繁杂的股票数据，要想对股票进行合理的分析和选择，聚类分析就显得尤为重要。在本文中，我们采用了改进K-means聚类法帮助客户...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 12月2日

SOM与k-means两阶段聚类算法

3条回答 默认 最新

问题分析

解决方案

问题事件

3条回答默认最新