StandardScaler().fit(data).var_和data.var()输出结果不同

StandardScaler().fit(data).var_和data.var()输出结果不同，是为什么呢

看到有博主说：
num = StandardScaler().fit(data) #计算出矩阵每一列的均值和方差
print('data的均值：num1.mean_) #打印出矩阵每一列的均值
print('data的方差：num1.var_) #打印出矩阵每一列的方差

我就拿着数据试了下：
均值没问题：

但是方差就对不上了：

有大师解疑下嘛

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

4条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
叫兽-郭老师新星创作者: Java技术领域 2024-02-07 15:27
关注
参考通义千问和郭老师的小迷弟雅思莫了-编写提供，主要是为了帮助您快速解决问题，如下回答，您可以参考下，如有问题，评论区留言。
StandardScaler() 是 Scikit-learn 中的一个预处理方法，它对数据进行标准化处理，即把数据按列（特征）缩放，使得每列数据都具有零均值和单位方差。这里的“单位方差”指的是经过变换后，每列数据的标准差变为1。

当你直接使用 data.var() 计算原始数据的方差时，得到的是未经标准化处理的各列特征的原始方差。

而当你使用 StandardScaler().fit(data).var_ 时，得到的是在标准化变换中计算出的新标准差的倒数（因为 var_ 属性存储的是每个特征的方差的逆，用于标准化过程中的除法操作）。因此，这个结果与原始数据的方差不同是正常的。

如果你想查看标准化后的数据的方差，可以对标准化后的数据做同样的方差计算：

scaler = StandardScaler() scaled_data = scaler.fit_transform(data) scaled_data.var()

此时得到的结果应该是接近于 [1, 1, ..., 1] 的形式（具体长度取决于特征数量），这是因为标准化的目标就是让变换后的数据具有单位方差。
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

sklearn：sklearn.preprocessing.StandardScaler函数的fit_transform、transform、inverse_transform简介、使用方法之详细攻略
2020-03-04 01:04

一个处女座的程序猿的博客 sklearn：sklearn.preprocessing.StandardScaler函数的fit_transform、transform、inverse_transform简介、使用方法之详细攻略目录 StandardScaler函数的的简介及其用法 StandardScaler函数的的简介 ...
TensorFlow tf.data 导入数据（tf.data官方教程）
2018-11-23 17:03

loveliuzz的博客导入数据（Reading data） TensorFlow读取数据的四种方法：tf.data、Feeding、QueueRunner、Preloaded data。本篇的内容主要介绍 tf.data API的使用目录导入数据（Reading data） 1....
Tensorflow 2.x(keras)源码详解之第九章：模型训练和预测的三种方法(fit&tf.GradientTape&train_step&tf.data)
2022-05-16 10:05

爱编程的喵喵的博客 add_metric2.4 自动切分验证集2.5 使用tf.data数据进行训练2.6 使用tf.keras.utils.Sequence数据进行训练2.7 多输出，指定不同的损失函数和评估指标2.8 样本不均衡：类权重和样本权重2.9 使用回调(callbacks)2.10 ...
机器学习中的 fit()、transform() 与 fit_transform()：原理、用法与最佳实践
2025-11-05 18:42

流烟默的博客机器学习中的fit()、transform()和fit_transform()方法详解：fit()用于从数据中学习转换规则或模型参数（如均值/方差等统计量），不改变原始数据；transform()应用已学规则进行数据转换；fit_transform()则合并两步...
做数据处理，你连 fit、transform、fit_transform 都分不清？
2020-12-23 18:02

小一的学习笔记的博客关注+星标，听说他有点东西全文共1413字，阅读全文需8分钟大家好，我是小一这节内容源自于上节的延伸：数据处理中的标准化、归一化，究竟是什么？在上一节介绍数据处理中的归一化和标准化...
sklearn.preprocessing.StandardScaler数据标准化
2019-09-29 04:12

banjianmu3630的博客那么它将会在算法学习中占据主导位置，导致我们的学习器不能像我们期望的那样，去学习其他的特征，这将导致最后的模型收敛速度慢甚至不收敛，因此我们需要对这样的特征数据进行标准化/归一化。 1.StandardScaler ...
TF2-Tips：自定义model.fit
2022-04-01 16:59

一只用R的浣熊的博客 x, y = data # 这个data就是传入model.fit()的数据 with tf.GradientTape() as tape: y_pred = self(x, training=True) # Forward pass # Compute the loss value # (the loss function is configured in `compile...
光谱数据处理：1.特征波长优选的不同方法与Python实现
2024-02-25 02:44

nnerddboy的博客五种光谱数据的特征波长优选方法与Python实现，五种方法分别是主成分分析法(PCA)、协同区间偏最小二乘法（SiPLS）、连续投影算法（SPA）、竞争自适应重采样算法（CARS）和随机蛙跳算法（Random-Frog）。
statsmodels 笔记：VAR
2021-11-07 10:17

UQI-LIUWJ的博客 1 数据&库函数 import numpy as np import pandas import statsmodels.api as sm from statsmodels.tsa.api import VAR mdata = sm.datasets.macrodata.load_pandas().data dates = mdata[['year', 'quarter'...
第一章 UCI数据集wine.data主成分分析PCA
2022-03-13 21:26

Big波斯的博客第一章 UCI数据集wine.data主成分分析PCA 文章目录第一章 UCI数据集wine.data主成分分析PCA前言一、是什么PCA？二、PCA算法流程二、使用步骤1.引入库2.读入数据3.数据标准化（规范化）4.主成分分析PCA5.PCA可视化...
sklearn 数据处理 fit、transform、fit_transform 的区别
2021-04-02 17:33

胖胖胖胖胖虎的博客也就是说，通过 fit 函数可以先对需要归一化的数据集进行最大、最小值的计算，至于说最终归一化的结果是多少，对不起，fit 函数到此为止了。所以，在 MinMaxScaler 的 fit 之后可以查看数据集中的最大、最小值 ...
Sklearn之数据预处理——StandardScaler
2020-10-09 15:36

云兮书嗣的博客机器学习模型被互联网行业广泛应用，一般做机器学习应用的时候大部分时间是花费在特征处理上，其中很关键的一步就是对特征数据进行归一化，为什么要归一化呢？维基百科给出的解释：归一化后加快了梯度下降求最优...
Python机器学习库SKLearn：数据预处理
2019-05-06 20:17

wamg潇潇的博客将输入的数据转化成机器学习算法可以使用的数据。包含特征提取和标准化。原因：数据集的标准化（服从均值为0方差为1的标准正态分布（高斯分布））是大多数机器学习算法的常见要求。如果原始数据不服从高斯分布...
机器学习-Sklearn-04（降维算法PCA和SVD）
2022-02-26 23:25

Henrik698的博客机器学习-Sklearn-04（降维算法PCA和SVD）
Sklearn中数据预处理
2022-03-05 13:53

sshi9的博客在机器学习算法实践中，我们往往有着将不同规格的数据转换到同一规格，或不同分布的数据转换到某个特定分布的需求，这种需求统称为将数据“无量纲化”。数据的无量纲化可以是线性的，也可以是非线性的。线性的...
机器学习笔记（8）——数据预处理&特征工程
2022-05-20 13:39

朝荣的博客机器学习笔记（8）——数据预处理&特征工程 1. 数据预处理 1.1. 数据无纲量化 1.2.缺失值 1.3. 处理分类型特征 1.4.处理连续型特征 2. 特征选择 2.1.过滤法fliter 2.1.1方差过滤 2.1.2卡方过滤 2.1.3选取...
【sklearn】fit()、transform()和fit_transform()的区别
2022-09-13 22:49

旅途中的宽~的博客【sklearn】fit()、transform()和fit_transform()的区别
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 2月7日

StandardScaler().fit(data).var_和data.var()输出结果不同

4条回答 默认 最新

问题事件

4条回答默认最新