pytorch 序列预测为什么验证loss远大于训练loss

有谁知道这是为什么test loss会远大于train loss吗？
也尝试过减小网络深度，减小神经元数量图像也是这样
也使用过dropout，batchnomal 等方法图形也是这样，并且使用这俩方法后mae rmse 变大
也尝试过增加样本量，上图是使用14016个个样本训练的，样本增加为21024个样本后，图像还是这样，并且mape>1,完全变成劣质模型了。

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
QuietNightThought 人工智能领域新星创作者 2023-06-29 09:49
关注
过拟合是指模型在训练集上表现很好，但在测试集上表现较差的情况。这意味着模型对于训练集中的噪声和细节过度拟合，导致在未见过的数据上性能下降。

减小网络深度、减小神经元数量、使用dropout和batch normalization等方法都是为了尝试减少模型复杂度来防止过拟合。然而，在某些情况下，这些方法可能并不能有效地解决过拟合问题，或者说并不是根本原因。

如果在加入这些方法后，模型的MAE和RMSE也变大，并且增加样本量仍然没有改善模型性能，那么可能需要考虑其他原因。以下是一些可能的原因和解决方法：

当test loss远大于train loss时，过拟合可能是主要原因。在尝试减小模型复杂度、增加样本量等常见方法后仍然无法改善情况，可能需要进一步分析数据的特点和模型设计的问题，并进行适当的调整和优化。
比如：
数据不足或质量不高：即使增加样本量，如果数据的多样性不够或者存在噪声，模型也难以泛化到新的数据上。此时可以尝试获取更多的高质量数据，或者进行数据清洗和增强处理。
特征选取不当：模型的性能也受特征选择的影响。确保选择的特征具有良好的信息量和代表性。
模型复杂度不适合：模型过于简单或过于复杂都可能导致性能下降。需要根据具体问题调整模型的复杂度，实现适当的平衡。
超参数调节不当：例如学习率、正则化参数等超参数的选择也会对模型性能产生影响。尝试通过交叉验证等方法来优化超参数的选择。
这个要多实验才能确定

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

报告相同问题？

关注问题

CNN训练时，为什么每次训练的loss没有持续下降的趋势 cnn pytorch 神经网络
2022-02-07 14:29

回答 2 已采纳你是指每个epoch对不同的数据集还是对同一个数据集训练loss没有下降，这是两回事每个epoch对不同数据集的话，那我无话可说，你开心就好对同一个数据集loss没有下降，那是应为你这才几个epoch
pytorch加载训练好的模型进行预测时，为什么又开始训练了 python 自然语言处理
2021-06-01 17:16

回答 2 已采纳因为你在run里的训练代码没有封装城函数，直接全局执行，import run.py 就开始xun lian le
pytorch的MNIST代码中loss输出的疑问人工智能机器学习深度学习神经网络
2020-06-29 00:25

回答 1 已采纳 https://www.jianshu.com/p/3db91d6bdf83
Pytorch训练模型损失Loss为Nan或者无穷大（INF）原因
2022-02-12 12:20

ytusdc的博客相信很多人都遇到过训练一个deep model的过程中，loss突然变成了NaN。在这里对这个问题做一个总结： 1.如果在迭代的100轮以内，出现NaN，一般情况下的原因是因为你的学习率过高，需要降低学习率。可以不断降低学习...
pytorch训练时cuda内存不足 pytorch 目标检测神经网络
2023-03-02 15:28

回答 2 已采纳通常遇到OOM(out of memory)问题, 只有两种解决方案, 降低您网络训练时的batchsize, 或者选用更小的网络. 看到您这里用的resnet50, 8Gmemory够用了, 您可以
pytorch 构建预测模型使用python bert pytorch 有问必答深度学习
2023-03-14 18:46

回答 2 已采纳文章：python pytorch使用中也许有你想要的答案，请看下吧
pytorch训练完一个epoch计算验证集精度时怎样释放显存深度学习神经网络计算机视觉
2023-02-18 15:36

回答 2 已采纳基于Monster 组和GPT的调写：使用torch.cuda.empty_cache()函数手动释放显存。如果想要在每个epoch的训练结束后释放训练集显存，可以在每个epoch结束时调用该函数。
Triplet Loss 和 Center Loss详解和pytorch实现
2019-08-01 16:44

酉意铭的博客最近在学习ReID相关的算法，为了提高ReID的性能通常会采用softmax loss 联合 Triplet Loss和Center Loss来提高算法的性能。本文对Triplet Loss和Cnetr Loss做一个总结，以简洁的方式帮助理解。 Triplet Loss和...
pytorch训练的DeepFM模型的调用 pytorch 人工智能深度学习
2022-08-09 20:08

回答 1 已采纳没太明白，既然你都训练出来了，不应该知道怎么去推理吗？我理解deepfm输入基本上都是一些one-hot好的特征，你可以直接load训练好的pth文件，然后model(feature)就能输出某一用户
pytorch中这个数值为什么不变呢？ pytorch
2022-09-17 23:58

回答 1 已采纳我猜测tensor.data返回的应该是数据的副本而不是视图，所以x不会改变。tensor之间的计算直接使用tensor本身就好了，不需要使用data属性。你可以把tensor看作是多维数组，可以直接
pytorch能否训练一半停掉接着训练 python pytorch 神经网络
2021-09-15 17:48

回答 1 已采纳看这里：https://zhuanlan.zhihu.com/p/38056115
pytorch 绘制多个算法loss_pytorch tensorboard在本地和远程服务器使用，两条loss曲线画一个图上...
2021-01-13 15:31

weixin_39723010的博客查看PyTorch版本的命令为torch.__version__tensorboard若没有的话，可用命令conda install tensorboard安装，也可以用命令pip install tensorboard安装。注意：tensorboard可以直接实现可视化，不需要安装TensorFlow...
pytorch训练时怎么提高显卡的利用率？ pytorch 深度学习自然语言处理
2022-03-08 10:24

回答 2 已采纳 work number设置到cpu最大核心数，batch size 搞大点，你的显存才用了2G，还有那么多呢，不过显卡利用率低很正常，又不是挖矿，显卡很多时候要等硬盘或者内存读取信息呢。你把这里换成c
pytorch 实现SSD详细理解（三）loss的定义和训练
2020-04-08 16:57

视觉盛宴的博客在目标检测中loss的定义也是相当重要的一部分，SSD的loss定义是比较基础的，学习基础之后在去学restinanet的loss定义就轻松很多，定义loss是为了训练，让计算机知道自己的预测和真实标签的差距，通过不断的修改权重...
Focal Loss的理解以及在多分类任务上的使用(Pytorch)
2020-12-17 11:12

GHZhao_GIS_RS的博客理解关键点一二分类和多分类的交叉熵的区别二分类交叉熵多分类交叉熵理解关键点二多分类和二分类focal loss 理解关键点三 alpha到底该如何设置
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 9月2日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 8月25日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 5月30日

悬赏问题

¥50 求一位精通京东相关开发的专家
¥100 求懂行的大ge给小di解答下！
¥15 pcl运行在qt msvc2019环境运行效率低于visual studio 2019
¥15 MAUI,Zxing扫码，华为手机没反应。可提高悬赏
¥15 python运行报错 ModuleNotFoundError: No module named 'torch'
¥100 华为手机私有App后台保活
¥15 sqlserver中加密的密码字段查询问题
¥20 有谁能看看我coe文件到底哪儿有问题吗？
¥20 我的这个coe文件到底哪儿出问题了
¥15 matlab使用自定义函数时一直报错输入参数过多

pytorch 序列预测 为什么验证loss远大于训练loss

2条回答 默认 最新

问题事件

悬赏问题

pytorch 序列预测为什么验证loss远大于训练loss

2条回答默认最新