Guang_han 2023-05-30 15:33 采纳率: 40%
浏览 15
已结题

pytorch 序列预测 为什么验证loss远大于训练loss

img


有谁知道这是为什么test loss会远大于train loss吗?
也尝试过减小网络深度,减小神经元数量图像也是这样
也使用过dropout,batchnomal 等方法图形也是这样,并且使用这俩方法后mae rmse 变大
也尝试过增加样本量,上图是使用14016个个样本训练的,样本增加为21024个样本后,图像还是这样,并且mape>1,完全变成劣质模型了。

  • 写回答

2条回答 默认 最新

  • QuietNightThought 人工智能领域新星创作者 2023-06-29 09:49
    关注

    过拟合是指模型在训练集上表现很好,但在测试集上表现较差的情况。这意味着模型对于训练集中的噪声和细节过度拟合,导致在未见过的数据上性能下降。

    减小网络深度、减小神经元数量、使用dropout和batch normalization等方法都是为了尝试减少模型复杂度来防止过拟合。然而,在某些情况下,这些方法可能并不能有效地解决过拟合问题,或者说并不是根本原因。

    如果在加入这些方法后,模型的MAE和RMSE也变大,并且增加样本量仍然没有改善模型性能,那么可能需要考虑其他原因。以下是一些可能的原因和解决方法:

    当test loss远大于train loss时,过拟合可能是主要原因。在尝试减小模型复杂度、增加样本量等常见方法后仍然无法改善情况,可能需要进一步分析数据的特点和模型设计的问题,并进行适当的调整和优化。
    比如:
    数据不足或质量不高:即使增加样本量,如果数据的多样性不够或者存在噪声,模型也难以泛化到新的数据上。此时可以尝试获取更多的高质量数据,或者进行数据清洗和增强处理。
    特征选取不当:模型的性能也受特征选择的影响。确保选择的特征具有良好的信息量和代表性。
    模型复杂度不适合:模型过于简单或过于复杂都可能导致性能下降。需要根据具体问题调整模型的复杂度,实现适当的平衡。
    超参数调节不当:例如学习率、正则化参数等超参数的选择也会对模型性能产生影响。尝试通过交叉验证等方法来优化超参数的选择。
    这个要多实验才能确定

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

问题事件

  • 系统已结题 9月2日
  • 已采纳回答 8月25日
  • 创建了问题 5月30日

悬赏问题

  • ¥50 求一位精通京东相关开发的专家
  • ¥100 求懂行的大ge给小di解答下!
  • ¥15 pcl运行在qt msvc2019环境运行效率低于visual studio 2019
  • ¥15 MAUI,Zxing扫码,华为手机没反应。可提高悬赏
  • ¥15 python运行报错 ModuleNotFoundError: No module named 'torch'
  • ¥100 华为手机私有App后台保活
  • ¥15 sqlserver中加密的密码字段查询问题
  • ¥20 有谁能看看我coe文件到底哪儿有问题吗?
  • ¥20 我的这个coe文件到底哪儿出问题了
  • ¥15 matlab使用自定义函数时一直报错输入参数过多