为什么Python归一化或者标准化后，还原数据集与原数据集不一样？

标准化代码：

X_train=standar_scaler.fit_transform(X_train)

X_test=standar_scaler.fit_transform(X_test)

X_yz=standar_scaler.fit_transform(X_yz)

y_train=standar_scaler.fit_transform(y_train)

y_test=standar_scaler.fit_transform(y_test)

y_yz=standar_scaler.fit_transform(y_yz)

反标准化代码：
X_train=standar_scaler.inverse_transform(X_train)

X_test=standar_scaler.inverse_transform(X_test)

X_yz=standar_scaler.inverse_transform(X_yz)

y_train=standar_scaler.inverse_transform(y_train.reshape(1,-1))

y_test=standar_scaler.inverse_transform(y_test.reshape(1,-1))

y_yz=standar_scaler.inverse_transform(y_yz.reshape(1,-1))

其中，X_test和y_test是事先从数据集中提取出来的测试。

train和yz是训练集和验证集,通过train_test_split函数得到。

分别打印y_test和y_yz标准化前，以及反标准化后（即还原数据集），y_yz是完全一致的，y_test反标准化后数据有较大出入。

还原后的前十列：

[40.32316205 39.60171329 40.69419283 40.32316205 41.35387819 37.87023625
37.84962336 37.76717211 38.30310548 39.33374656]

标准化前的前十列：

[44.74975586 45.0623703 45.07076263 44.53993988 45.26588821 45.00152588
45.24700546 44.7833252 45.26379013 44.65953064]

请教这是怎么回事？

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

3条回答

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
threenewbee 2019-06-12 18:29
关注
看下你有没有打乱或者拆分过数据

解决 2
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

Python数据集标准化之后的均值是0吗 python 人工智能算法
2022-05-25 22:36

回答 1 已采纳原因：因为transfer.mean_和transfer.var_是transfer针对训练集学习到的均值和方差，并不是标准化后数据的均值和方差。解决：使用ret_data.mean(axis=0)和
如何使用python对excel做归一化处理并保存？ python 数据挖掘有问必答机器学习
2022-03-27 15:20

回答 2 已采纳按列试试 axis=0
请问Python 聚类分析的数据标准化是什么意思呢？为什么要做这一步操作？？ python 数据分析
2022-01-31 20:47

回答 1 已采纳快速聚类，不需要对变量进行标准化的，但仍然推荐进行标准化。层次聚类，必须进行标准化，因为各变量的量纲会有差异。简单的说，第一列数据的单位是万元，第二列数据的单位是元，如果不做标准化第一列就会被忽
【Python机器学习系列】一文彻底搞懂机器学习中的归一化与反归一化问题
2023-12-05 14:18

数据杂坛的博客一文彻底搞懂机器学习中的归一化与反归一化问题
python列表数据归一化处理 python
2022-07-24 21:46

回答 3 已采纳 for i=0:5不是python的语法,你这是matlab的代码, 不能用python运行python的语法应该是for i in range(0,5):
如何用UCI数据集测试基于卡方分裂的离散化方法？Python实习 python 算法
2023-04-21 12:56

回答 2 已采纳最近我也在看着块，我把我的方法说一下可以从UCI数据集中选择适当的数据集进行实验，并与其他离散化算法进行比较。首先，需要对数据集进行预处理，包括数据清洗、特征选择和标准化等步骤。然后，可以使用不同的离
python数据标准化 python
2023-03-15 15:22

回答 2 已采纳针对您的问题，您可以按照以下步骤进行每一组数据的标准化：将数据按照组别分组，可以使用pandas库中的groupby()函数。 import pandas as pd # 假设数据存储在DataF
机器学习-Sklearn（第三版）Day3 数据预处理（数据标准化&归一化&正则化）
2022-12-20 21:38

小浩码出未来！的博客并且，尽管去量纲化过程不是具体的算法，但在fit接口中，依然只允许导入至少二维数组，一维数组导入会报错。通常来说，我们输入的X会是我们的特征矩阵，现实案例中特征矩阵不太可能是一维所以不会存在这个问题。...
Python数据分析与可视化实践 python 数据分析
2021-11-02 21:07

回答 1 已采纳 import numpy as np z＝np.ones((9，),dtype="int64") Z=z.reshape(3,3) Z[2][3]＝1 如果报错，可能我的是中文输入的。请改成英文。手
含负数数据如何标准化
2018-01-12 08:14

回答 3 已采纳或者 x' = x/ max(fabs(x)) ；或者 x' = 2 * ( x - ( max(x) + min(x) ) * 0.5 ) / ( max(x) - min(x))，但是
python float和百分数的数据归一化 python 有问必答
2021-08-09 20:52

回答 2 已采纳用pandas进行数据处理，选取需要处理的列，分别用数值计算和字符分割等方法，转换成你所需要的格式，代码如下： import pandas as pd df=pd.read_csv('891.csv'
天气预报：天气数据集爬取 + 可视化 + 13种模型预测
2020-05-10 15:59

荣仔！最靓的仔！的博客前几天一直在研究 Python 爬虫技术，只为从互联网上获取数据集。本文就是利用前几天学到的爬虫知识使用 Python 爬取天气数据集，并做的一期讨论日期与最低气温能是否是最高气温的影响因素，进而判断能否精确预测...
python归一化总是出问题 python 有问必答
2022-04-08 10:26

回答 3 已采纳代码没有问题，项目所在路径有中文，所以报错，还有py文件尽量不要用中文命名https://blog.csdn.net/datao3022/article/details/109186403
七月论文审稿GPT第3.2版和第3.5版：通过paper-review数据集分别微调Mistral、gemma
2024-03-12 17:27

v_JULY_v的博客我司由于一直在迭代论文审稿GPT...review数据集微调试下此外，去年Mistral instruct 0.1因为各种原因导致没跑成功时，我总感觉Mistral应该没那么拉胯，总感觉得多实验几次，所以打算再次尝试下Mistral instruct 0.2。
深度学习-各种归一化(Batch Norm、Layer Norm、Group Norm、InstanceNorm、Spatially-Adaptive Norm）
2022-03-30 19:38

HheeFish的博客数据的归一化操作是数据处理的一项基础性工作，本文主要介绍了现有的四种归一化方法，包括Batch Normalization、Layer Normalization、Group Normalization、InstanceNorm以及近期在图像翻译领域遇到的Spatially-...
没有解决我的问题, 去提问

悬赏问题

¥15 如何在scanpy上做差异基因和通路富集？
¥20 关于#硬件工程#的问题，请各位专家解答！
¥15 关于#matlab#的问题：期望的系统闭环传递函数为G(s)=wn^2/s^2+2¢wn+wn^2阻尼系数¢=0.707，使系统具有较小的超调量
¥15 FLUENT如何实现在堆积颗粒的上表面加载高斯热源
¥30 截图中的mathematics程序转换成matlab
¥15 动力学代码报错，维度不匹配
¥15 Power query添加列问题
¥50 Kubernetes&Fission&Eleasticsearch
¥15 報錯：Person is not mapped，如何解決？
¥15 c++头文件不能识别CDialog