原始dc是数据总量的1%-2%,那么归一化之后该值该如何取
1条回答 默认 最新
报告相同问题?
提交
相关推荐 更多相似问题
- 2022-01-16 22:16回答 2 已采纳 # 整理聚类结果 listName = dfData['地区'].tolist() # 将 dfData 的首列 '地区' 转换为 listName dictCluster
- 2022-01-31 20:47回答 1 已采纳 快速聚类,不需要对变量进行标准化的,但仍然推荐进行标准化。 层次聚类,必须进行标准化,因为各变量的量纲会有差异。简单的说,第一列数据的单位是 万元,第二列数据的单位是 元,如果不做标准化第一列就会被忽
- 2021-08-12 11:03回答 4 已采纳 你这个数组是三维的啊,虽然不清楚sklearn的kmeans函数具体用法,但传入的X不是矩阵形式啊,应该是二维数组吧
- 2022-02-11 17:08回答 2 已采纳 改成np.power()试试: import numpy as np a=np.array([1,2,3,4]) b=np.array([2]) print(np.power(a,b))
- 2021-11-08 09:09回答 1 已采纳 分类: km = KMeans(n_clusters=4) km.fit_predict(data) 分完类之后得到了聚类中心,也就是km.cluster_centers_,你可以print出来:
- 2022-02-11 21:14回答 2 已采纳 元组的索引越界,打印一下len(dataset),n取值已经超过了a,b元组元素个数。
- 2021-10-11 12:21回答 1 已采纳 问题搞复杂了吧,在clustermap中设置参数metric="correlation"就行了,例如 g = sns.clustermap(iris, metric="correlation")
- 2019-05-01 20:24回答 2 已采纳 用户出行模式的问题通常不单单是找出地图上的热点区域的问题, 而是一个多维度的包括时间的聚类. 所用到的维度可能包括乘车日期, 上车时间,下车时间, 乘车站点, 类型(地铁,出租...).... 之
- 2021-03-07 23:56回答 3 已采纳 matplotlib画出来呗。。。三维以内的都能画
- 2021-07-28 17:52回答 1 已采纳 K-均值是发现给定数据集的k个簇的算法。簇个数k是用户给定的,每一个簇通过其质心(centroid),即簇中所有点的中心来描述。该算法是循环迭代式的。(1)初始化:随机选择K个点作为初始中心点,每个点
- 没有解决我的问题, 去提问