2301_77333840 2023-03-30 08:58 采纳率: 100%
浏览 37
已结题

深度学习训练时,一开始损失值就显示nan

img


训练开始损失值为nan,但是用一半数据进行训练损失值就正常显示,是什么原因呢?

  • 写回答

3条回答 默认 最新

  • apples_kk 2023-03-30 11:03
    关注

    可能的原因有:

    1. 数据不全面:原始数据可能存在缺失值或者异常值,而使用较少的数据进行训练会减少数据中的特殊值,减少损失值NaN的出现。
    2. 非常大的学习率:使用较大的学习率可能会导致损失值NaN,因为学习率太大,会导致参数太过激进,从而导致训练损失值出现NaN的情况。而用较少的数据训练时可以避免这种情况。
    3. 神经网络架构设计错误:深度学习的神经网络参数设计错误会导致训练的损失值NaN。
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(2条)

报告相同问题?

问题事件

  • 系统已结题 4月8日
  • 已采纳回答 3月31日
  • 创建了问题 3月30日