深度学习做回归问题如何对数据集进行标准化，归一化？

问题描述

使用深度学习RNN模型预测目标轨迹。输入过去一段时间目标的运动轨迹预测未来某一时刻目标的位置。现在已有一些轨迹的数据，在训练之前应该如何对数据进行标准化/或者归一化呢？或者是不需要进行这个处理？（自己试了没有标准化数据时模型难以训练，使用的损失函数是mean_squared_error）

找的一些标准化/归一化方法

zero-mean normalization
```
x  = (x - μ ) / σ  # μ是样本均值，σ是样本方差
```
很多文献和网上的例子使用这种方法，但是这个方法有个很严重的问题，公式中的μ ， σ是更具已有的数据集计算得到的，实际运用中是想利用新测到的数据预测目标未来的位置，显然新测量到的数据无法使用原来的μ ，σ进行处理。
Min-max normalization
```
x = (x - min)/(max - min)  #min是样本最小值，max是样本最大值
```
由于目标的位置，例如（x, y）未知，min和max无法确定，网友建议使用理论的最大值，最小值计算，但是这可能导致数据发布极不平衡，暂时没尝试过这种方法。

3.**atan函数转换**

x = atan(x) * 2 / π

这个方法可以把数据映射到[0,1]。使用这个方法遇到了两个个问题，使用反正切计算后得到的预测结果偏差很大（模型训练时损失在0.02以下），另一个问题是，由于模型有误差，当真实值接近1（标准化以后）时，模型预测可能超过1，这样计算反正切结果为负，所以放弃这种方法。

寻求的帮助

请问各位大佬，这类问题应该怎么对数据集进行预处理，网上找的很多方法，并没有很好的解决。

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
麦菲壳 2021-03-24 15:38
关注
我的做法是使用Min-max归一化，记录模型训练使用的数据的最大值和最小值，训练过后进行预测时，使用训练时记录的最大值和最小值对预测结果进行反归一化。

解决
无用 1
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

如何使用python对excel做归一化处理并保存？ python 数据挖掘有问必答机器学习
2022-03-27 15:20

回答 2 已采纳按列试试 axis=0
数据归一化和标准化之后会不会对原始数据的信息量以及结构产生影响？
2018-12-07 02:54

回答 1 已采纳这个要看你什么类型的数据，如果你有多批数据，并且各自归一化，那么它们之间的关联就被破坏了。另一个要考虑的是精度的问题，一些噪声数据如果偏离比较远，而你的精度不够，那么归一化会损失精度。
模型网络有bn层，必须要对输入的训练和测试数据进行归一化处理吗? python pytorch 深度学习
2022-03-22 17:29

回答 1 已采纳输入归一化和模型中的bn这两不一样建议都加上 归一化会方便网络拟合和泛化
深度学习_深度学习基础知识_数据归一化
2020-03-22 22:26

Rocky Ding*的博客 归一化的主要公式 1.将数据归一到[0,1]： x′=x−min(x)max(x)−min(x)x^{\prime} =\frac{x - min(x)}{max(x)-min(x)} x′=max(x)−min(x)x−min(x) 其中max(x)max(x)max(x)和min(x)min(x)min(x)分别是数据的最大...
matlab 如何用削波对数据进行归一化？ matlab 有问必答
2021-10-17 10:49

回答 1 已采纳同学，matlab归一化函数不止mapminmax呢，还有诸如mapstd（均值为0方差为1），你可以试一试，这个其实也非常常用，用法跟mapminmax是一致的。比如 [Y,PS] = mapstd
如何对数据进行归一化处理 matlab 人工智能有问必答算法
2021-10-15 10:41

回答 1 已采纳简单的说，归一化处理就是将一组数按比列(或算法)转换成一组每个成员都小于等于1的数按你给的图举例：u1组 8350 7455 11000 9624 以最大的数 11000 为分母归一化8350/
使用pandas进行数据归一化一些问题 python 机器学习
2022-04-14 10:56

回答 1 已采纳可尝试修改 data=pd.read_csv('dating.txt', encoding = 'gbk')
回归问题归一化总结
2022-05-25 15:54

QFIUNE的博客在用深度学习做回归问题时，对数据进行标准化处理是一个共识，将数据标准化，利用标准化后得数据进行数据分析。不同评价指标往往具有不同的量纲和量纲单位，这样的情况会影响到数据分析的结果，为了消除指标之间的...
关于#数据归一化和预测数据无法归一化#的问题，如何解决？ matlab 回归神经网络
2023-04-16 12:10

回答 3 已采纳已解决。参考大佬思路。这样一来就解决工程化办法。老饼讲解|【例子】提取BP神经网络的数学表达式DEMOhttp://bp.bbbdata.com/site/text/49
四维光谱图像如何进行归一化? python 机器学习计算机视觉
2022-03-31 21:57

回答 2 已采纳如果是从光谱维度来说，当然是从光谱维度进行归一化。从图像的层面就用二维数据的归一化方式。差异的话试试才知道
含负数数据如何标准化
2018-01-12 08:14

回答 3 已采纳或者 x' = x/ max(fabs(x)) ；或者 x' = 2 * ( x - ( max(x) + min(x) ) * 0.5 ) / ( max(x) - min(x))，但是
深度学习中的数据归一化
2020-12-14 13:41

柠檬巧克力、的博客最近在做低氧舱滞后时间模拟的项目中遇到了输入数据量纲不同的情况，使用归一化和直接学习对比的情况发现训练结果大有不同。因此记录一下。 归一化作用基本原理实现方法什么时候需要归一化实例：归一化前后数据训练...
请问：数据归一化问题 python 深度学习神经网络
2021-01-27 15:42

回答 1 已采纳一般输入进行过归一化后，在神经网络中区间都不会发生改变，所以输出不需要再进行归一化了，但是此时输出可能并非是所需要的输出值，需要进行反归一化处理后才能得到所需要的数据。
规范化：标准化、归一化、中心化
2023-08-31 16:09

光尘92的博客 1、归一化（Normalization）概念：数值的归一，将数值规约到(0,1)或(-1,1)区间目的：消除量纲，便于不同单位或量级的指标能够进行比较和加权。2、标准化（Standardization）概念：数据分布的归一，原始数据减均值...
深度学习 归一化
2021-07-13 17:17

李晋益的博客 深度学习之两种常见 归一化 方法 1 归一化的定义 归一化是在数据准备过程中应用的一种方法，当数据中的特征具有不同的范围时，为了改变数据集中数字列的值，使用相同的尺度（使特征的数值处于相同的数量级），可以...
没有解决我的问题, 去提问

悬赏问题

¥15 有人知道怎么将自己的迁移策略布到edgecloudsim上使用吗？
¥15 错误 LNK2001 无法解析的外部符号
¥50 安装pyaudiokits失败
¥15 计组这些题应该咋做呀
¥60 更换迈创SOL6M4AE卡的时候，驱动要重新装才能使用，怎么解决？
¥15 让node服务器有自动加载文件的功能
¥15 jmeter脚本回放有的是对的有的是错的
¥15 r语言蛋白组学相关问题
¥15 Python时间序列如何拟合疏系数模型
¥15 求学软件的前人们指明方向🥺