为什么Python归一化或者标准化后，还原数据集与原数据集不一样？

标准化代码：

X_train=standar_scaler.fit_transform(X_train)

X_test=standar_scaler.fit_transform(X_test)

X_yz=standar_scaler.fit_transform(X_yz)

y_train=standar_scaler.fit_transform(y_train)

y_test=standar_scaler.fit_transform(y_test)

y_yz=standar_scaler.fit_transform(y_yz)

反标准化代码：
X_train=standar_scaler.inverse_transform(X_train)

X_test=standar_scaler.inverse_transform(X_test)

X_yz=standar_scaler.inverse_transform(X_yz)

y_train=standar_scaler.inverse_transform(y_train.reshape(1,-1))

y_test=standar_scaler.inverse_transform(y_test.reshape(1,-1))

y_yz=standar_scaler.inverse_transform(y_yz.reshape(1,-1))

其中，X_test和y_test是事先从数据集中提取出来的测试。

train和yz是训练集和验证集,通过train_test_split函数得到。

分别打印y_test和y_yz标准化前，以及反标准化后（即还原数据集），y_yz是完全一致的，y_test反标准化后数据有较大出入。

还原后的前十列：

[40.32316205 39.60171329 40.69419283 40.32316205 41.35387819 37.87023625
37.84962336 37.76717211 38.30310548 39.33374656]

标准化前的前十列：

[44.74975586 45.0623703 45.07076263 44.53993988 45.26588821 45.00152588
45.24700546 44.7833252 45.26379013 44.65953064]

请教这是怎么回事？

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
threenewbee 2019-06-12 18:29
关注
看下你有没有打乱或者拆分过数据

解决 2
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

【Python机器学习系列】一文彻底搞懂机器学习中的归一化与反归一化问题
2023-12-05 14:18

数据杂坛的博客一文彻底搞懂机器学习中的归一化与反归一化问题
【深度学习-Day 27】模型调优利器：掌握早停、数据增强与批量归一化
2025-06-11 20:14

吴师兄大模型的博客今天，我们将聚焦于另外三个在实践中几乎无处不在的关键技术： * **早停法 (Early ... * **批量归一化 (Batch Normalization)**：它不仅能加速模型收敛，还能起到正则化的作用，是现代深度网络架构中的标配组件。
机器学习-Sklearn（第三版）Day3 数据预处理（数据标准化&归一化&正则化）
2022-12-20 21:38

小浩码出未来！的博客并且，尽管去量纲化过程不是具体的算法，但在fit接口中，依然只允许导入至少二维数组，一维数组导入会报错。通常来说，我们输入的X会是我们的特征矩阵，现实案例中特征矩阵不太可能是一维所以不会存在这个问题。...
13、文本处理：归一化、分词与分割技术详解
2025-11-20 12:21

info6的博客本文详细介绍了自然语言处理中的核心文本处理技术，包括文本归一化（如小写转换、词干提取与词形还原）、基于正则表达式的分词方法及NLTK分词器的应用，以及句子和单词层面的分割技术。通过具体代码示例和应用场景...
深度学习-各种归一化(Batch Norm、Layer Norm、Group Norm、InstanceNorm、Spatially-Adaptive Norm）
2022-03-30 19:38

HheeFish的博客数据的归一化操作是数据处理的一项基础性工作，本文主要介绍了现有的四种归一化方法，包括Batch Normalization、Layer Normalization、Group Normalization、InstanceNorm以及近期在图像翻译领域遇到的Spatially-...
Cleer Arc5情感识别AI模型训练数据集
2025-11-21 01:47

爱分析的博客 Cleer Arc5通过多模态生理与行为数据构建情感识别AI模型，融合语音、骨传导、PPG和IMU信号，结合心理学标注与VAD情绪模型，实现精准、实时、隐私安全的情绪感知，推动智能设备走向人性化交互。
基于Python的微博评论情感分析实战项目（含源码与数据集）
2025-11-25 18:13

马屿人的博客全角转半角 & 大小写归一化 比如“ＡＩ芯片”和“AI芯片”，看着一样，编码却完全不同。必须统一！ def full_to_half(text): result = "" for char in text: code = ord(char) if code == 12288: # 全角空格 result...
AI人工智能：多模态数据融合为智能诊断系统赋能
2025-07-05 17:14

AI原生应用开发的博客但传统的AI诊断系统大多是“偏科生”：有的只会分析图像（比如识别肺结节），有的只会处理文本（比如从病历中提取病史），它们就像戴着“单镜片眼镜”，只能看到疾病的一个侧面。多模态数据融合。
python机器学习之数据的预处理（五种方式数据处理案例详解）
2024-04-18 15:39

人工智能-猫猫的博客 ① Python所有方向的学习路线图，清楚各个方向要学什么东西② 600多节Python课程视频，涵盖必备基础、爬虫和数据分析③ 100多个Python实战案例，含50个超大型项目详解，学习不再是只会理论④ 20款主流手游迫解爬虫...
人目标检测数据集person.zip实战应用与YOLO模型训练
2025-11-12 08:32

喵喵蜜的博客该数据集涵盖多种真实场景，具有良好的多样性，已成功用于YOLOv1至YOLOv4系列模型的训练与验证。本文详细介绍数据集结构、标注解析方法、基于TensorFlow或PyTorch的模型微调流程，以及使用IoU、AP、AR等指标进行性能...
没有解决我的问题, 去提问

为什么Python归一化或者标准化后，还原数据集与原数据集不一样？

3条回答 默认 最新

3条回答默认最新