卷积神经网络训练,用的是mnist数据集,第一次训练前损失函数还是一个值,训练一次之后就变成nan了,使用的损失函数是ce = tf.nn.sparse_softmax_cross_entropy_with_logits(logits=y, labels=tf.argmax(y_, 1)),cem = tf.reduce.mean(ce),应该不会出现真数为零或负的情况,而且训练前loss是存在的,只是训练后变为nan,求各位大牛答疑解惑,感激不尽。
1条回答 默认 最新
- qq_38669600 2019-02-18 00:25关注
你怎么训练的,有时候损失层中loss的计算可能导致NaN的出现或者梯度过大的话会导致Nan出现,建议检查激活函数的选择是不是好的,换换激活函数试试
解决 无用评论 打赏 举报