为什么Python归一化或者标准化后,还原数据集与原数据集不一样?

标准化代码:

X_train=standar_scaler.fit_transform(X_train)

X_test=standar_scaler.fit_transform(X_test)

X_yz=standar_scaler.fit_transform(X_yz)

y_train=standar_scaler.fit_transform(y_train)

y_test=standar_scaler.fit_transform(y_test)

y_yz=standar_scaler.fit_transform(y_yz)

反标准化代码:
X_train=standar_scaler.inverse_transform(X_train)

X_test=standar_scaler.inverse_transform(X_test)

X_yz=standar_scaler.inverse_transform(X_yz)

y_train=standar_scaler.inverse_transform(y_train.reshape(1,-1))

y_test=standar_scaler.inverse_transform(y_test.reshape(1,-1))

y_yz=standar_scaler.inverse_transform(y_yz.reshape(1,-1))

其中,X_test和y_test是事先从数据集中提取出来的测试。

train和yz是训练集和验证集,通过train_test_split函数得到。

分别打印y_test和y_yz标准化前,以及反标准化后(即还原数据集),y_yz是完全一致的,y_test反标准化后数据有较大出入。

还原后的前十列:

[40.32316205 39.60171329 40.69419283 40.32316205 41.35387819 37.87023625
37.84962336 37.76717211 38.30310548 39.33374656]

标准化前的前十列:

[44.74975586 45.0623703 45.07076263 44.53993988 45.26588821 45.00152588
45.24700546 44.7833252 45.26379013 44.65953064]

请教这是怎么回事?

1个回答

看下你有没有打乱或者拆分过数据

woshiwangxin0
楚暮天流 请问这有什么影响吗
一年多之前 回复
Csdn user default icon
上传中...
上传图片
插入图片
抄袭、复制答案,以达到刷声望分或其他目的的行为,在CSDN问答是严格禁止的,一经发现立刻封号。是时候展现真正的技术了!
立即提问
相关内容推荐