楚暮天流 2019-06-12 14:59 采纳率: 0%
浏览 3410

为什么Python归一化或者标准化后,还原数据集与原数据集不一样?

标准化代码:

X_train=standar_scaler.fit_transform(X_train)

X_test=standar_scaler.fit_transform(X_test)

X_yz=standar_scaler.fit_transform(X_yz)

y_train=standar_scaler.fit_transform(y_train)

y_test=standar_scaler.fit_transform(y_test)

y_yz=standar_scaler.fit_transform(y_yz)

反标准化代码:
X_train=standar_scaler.inverse_transform(X_train)

X_test=standar_scaler.inverse_transform(X_test)

X_yz=standar_scaler.inverse_transform(X_yz)

y_train=standar_scaler.inverse_transform(y_train.reshape(1,-1))

y_test=standar_scaler.inverse_transform(y_test.reshape(1,-1))

y_yz=standar_scaler.inverse_transform(y_yz.reshape(1,-1))

其中,X_test和y_test是事先从数据集中提取出来的测试。

train和yz是训练集和验证集,通过train_test_split函数得到。

分别打印y_test和y_yz标准化前,以及反标准化后(即还原数据集),y_yz是完全一致的,y_test反标准化后数据有较大出入。

还原后的前十列:

[40.32316205 39.60171329 40.69419283 40.32316205 41.35387819 37.87023625
37.84962336 37.76717211 38.30310548 39.33374656]

标准化前的前十列:

[44.74975586 45.0623703 45.07076263 44.53993988 45.26588821 45.00152588
45.24700546 44.7833252 45.26379013 44.65953064]

请教这是怎么回事?

  • 写回答

3条回答 默认 最新

  • threenewbee 2019-06-12 18:29
    关注

    看下你有没有打乱或者拆分过数据

    评论

报告相同问题?

悬赏问题

  • ¥20 使用Photon PUN2解决游戏得分同步的问题
  • ¥15 微带串馈天线阵列每个阵元宽度计算
  • ¥15 keil的map文件中Image component sizes各项意思
  • ¥30 BC260Y用MQTT向阿里云发布主题消息一直错误
  • ¥20 求个正点原子stm32f407开发版的贪吃蛇游戏
  • ¥15 划分vlan后,链路不通了?
  • ¥20 求各位懂行的人,注册表能不能看到usb使用得具体信息,干了什么,传输了什么数据
  • ¥15 Vue3 大型图片数据拖动排序
  • ¥15 Centos / PETGEM
  • ¥15 划分vlan后不通了