卷积神经网络训练loss变为nan

卷积神经网络训练，用的是mnist数据集，第一次训练前损失函数还是一个值，训练一次之后就变成nan了，使用的损失函数是ce = tf.nn.sparse_softmax_cross_entropy_with_logits(logits=y, labels=tf.argmax(y_, 1))，cem = tf.reduce.mean(ce)，应该不会出现真数为零或负的情况，而且训练前loss是存在的，只是训练后变为nan，求各位大牛答疑解惑，感激不尽。图片说明

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
qq_38669600 2019-02-18 00:25
关注
你怎么训练的，有时候损失层中loss的计算可能导致NaN的出现或者梯度过大的话会导致Nan出现，建议检查激活函数的选择是不是好的，换换激活函数试试

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

使用Keras编写的LSTM，训练时出现loss: nan - val_loss: nan，该如何调整？ keras lstm 有问必答深度学习
2022-05-03 18:40

回答 2 已采纳原数据第一列是时间形式的20220503这种，在读数据之后进行下面操作，你的数据是简单的1 2 34这种，数据可能在处理过程丢失或者变成nan了，你可以一步步看看每次处理后当前的数据现在是什么格式 d
total_loss正常但是val loss出现nan是怎么回事啊？深度学习神经网络
2021-03-15 16:35

回答 1 已采纳梯度下降的过程中因为中间网络层是随机生成的初始权重，所以梯度下降的过程中可能陷入了局部最优，可以通过调试batchsize或者lr等超参数解决。
yolov5训练损失为Nan python
2022-08-12 13:39

回答 1 已采纳将学习率改为0.00001，步子太大，扯到蛋了，改小点
卷积神经网络中loss值为nan的问题（已解决）
2018-09-04 12:20

喵嗷的博客 卷积神经网络中loss值为nan的问题最近一直在学习AI方面的东西。想自己搞一个类似MINST的东东，用搞基神经网络，样本用自制的样本……然鹅理想是骨感的，现实是永远吃不上饭的。经过与各种错误轮战后，出现了更大...
神经网络训练集损失值降为0而且一直保持 python 深度学习神经网络
2022-02-25 12:13

回答 1 已采纳（1）你没有给出模型，数据情况，谁也分析不了（2）训练误差小，测试误差大，这是典型的过拟合（3）损失值降为 0，还是下降很快，接近于 0，这是完全不同的，从问题描述和图中看不出来
keras训练卷积神经网络模型总是中断，发生未知错误 keras 机器学习深度学习
2021-11-15 18:25

回答 2 已采纳更新下pillow看看，如果还是这样，这张图片有问题，要么是你直接改的后缀而不是通过转换，要么是这种图已经损坏了，无法读取了
python构建神经网络训练模型的问题？ python 有问必答深度学习神经网络
2021-04-11 17:39

回答 3 已采纳 input_shape=(7787,)这里是不是少了一个参数
Loss变为NaN怎么办？
2021-07-07 22:13

OhMyJayce的博客在训练网络的时候，当打印出的日志提示loss变为NaN的时候，是不是整个人都开始抓狂了？相信应该每个算法工程师都遇到过这个令人头秃的问题。本文就是介绍如果遇到loss变成NaN时，如何快速的或者多方面排查原因。 ...
一维卷积神经网络训练时遇到报错：Vexpected conv1d_input to have 3 dimensions, but got array with shape (20430, 2048) python 有问必答深度学习
2022-03-19 16:13

回答 2 已采纳 39行input_shape = (2048, 1)是说单个个样本shape，因此模型的输入数据shape应为(n, 2048, 1)，可将52行改为 model.fit(x[train].resha
用BP神经网络进行预测，loss比较小，但预测值跟实际值相差较大，怎么办 keras python 有问必答神经网络
2021-07-19 21:04

回答 1 已采纳首先怀疑过拟合, 减少迭代次数, 像这种非常简单的数据拟合, 完全不需要200这么大的周期, 一般30-50个足够
我利用torch搭建了一个神经网络但是需要神经网络的输出控制在0-1之间训练后发生了梯度消失 python 人工智能神经网络
2021-04-25 02:16

回答 1 已采纳 1. 把loss函数也放出来看看 2. 先把中间的sigmoid改成Relu（或者其他变种），最后一层使用sigmoid
训练过程中Loss函数出现Nan的可能原因
2020-07-03 22:52

Jacob_Y7的博客综合我做过的一些实验，记录一下实验过程中Loss出现Nan的一些可能原因：最简单的，学习率过大。 BTW, 学习率过大还可能导致收敛到一个定值之前实验室的师姐拿云图做DNI分类的结果最后都收敛到同一个数值，结果我...
cuda报错，程序不训练，acc不增长，loss为Nan python tensorflow windows
2023-04-18 11:32

回答 3 已采纳 30系显卡要求11.0以上的cuda，推荐11.7
Pytorch训练模型损失Loss为Nan或者无穷大（INF）原因
2022-02-12 12:20

ytusdc的博客相信很多人都遇到过训练一个deep model的过程中，loss突然变成了NaN。在这里对这个问题做一个总结： 1.如果在迭代的100轮以内，出现NaN，一般情况下的原因是因为你的学习率过高，需要降低学习率。可以不断降低学习...
【人工智能项目】- 卷积神经网络实现游客评价情绪鉴别
2021-11-02 19:33

mind_programmonkey的博客【人工智能项目】- 卷积神经网络实现游客评价情绪鉴别本次主要任务是对游客发表的评价内容的情绪进行鉴别，积极还是消极。 import pandas as pd import numpy as np import matplotlib.pyplot as plt import os ...
没有解决我的问题, 去提问

悬赏问题

¥20 有关区间dp的问题求解
¥15 多电路系统共用电源的串扰问题
¥15 slam rangenet++配置
¥15 有没有研究水声通信方面的帮我改俩matlab代码
¥15 对于相关问题的求解与代码
¥15 ubuntu子系统密码忘记
¥15 信号傅里叶变换在matlab上遇到的小问题请求帮助
¥15 保护模式-系统加载-段寄存器
¥15 电脑桌面设定一个区域禁止鼠标操作
¥15 求NPF226060磁芯的详细资料

卷积神经网络训练loss变为nan

1条回答 默认 最新

悬赏问题

1条回答默认最新