卷积神经网络训练loss变为nan

卷积神经网络训练，用的是mnist数据集，第一次训练前损失函数还是一个值，训练一次之后就变成nan了，使用的损失函数是ce = tf.nn.sparse_softmax_cross_entropy_with_logits(logits=y, labels=tf.argmax(y_, 1))，cem = tf.reduce.mean(ce)，应该不会出现真数为零或负的情况，而且训练前loss是存在的，只是训练后变为nan，求各位大牛答疑解惑，感激不尽。图片说明

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
qq_38669600 2019-02-18 00:25
关注
你怎么训练的，有时候损失层中loss的计算可能导致NaN的出现或者梯度过大的话会导致Nan出现，建议检查激活函数的选择是不是好的，换换激活函数试试

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

使用Keras编写的LSTM，训练时出现loss: nan - val_loss: nan，该如何调整？ keras lstm 有问必答深度学习
2022-05-03 18:40

回答 2 已采纳原数据第一列是时间形式的20220503这种，在读数据之后进行下面操作，你的数据是简单的1 2 34这种，数据可能在处理过程丢失或者变成nan了，你可以一步步看看每次处理后当前的数据现在是什么格式 d
total_loss正常但是val loss出现nan是怎么回事啊？深度学习神经网络
2021-03-15 16:35

回答 1 已采纳梯度下降的过程中因为中间网络层是随机生成的初始权重，所以梯度下降的过程中可能陷入了局部最优，可以通过调试batchsize或者lr等超参数解决。
yolov5训练损失为Nan python
2022-08-12 13:39

回答 1 已采纳将学习率改为0.00001，步子太大，扯到蛋了，改小点
卷积神经网络中loss值为nan的问题（已解决）
2018-09-04 12:20

喵嗷的博客 卷积神经网络中loss值为nan的问题最近一直在学习AI方面的东西。想自己搞一个类似MINST的东东，用搞基神经网络，样本用自制的样本……然鹅理想是骨感的，现实是永远吃不上饭的。经过与各种错误轮战后，出现了更大...
神经网络训练集损失值降为0而且一直保持 python 深度学习神经网络
2022-02-25 12:13

回答 1 已采纳（1）你没有给出模型，数据情况，谁也分析不了（2）训练误差小，测试误差大，这是典型的过拟合（3）损失值降为 0，还是下降很快，接近于 0，这是完全不同的，从问题描述和图中看不出来
keras训练卷积神经网络模型总是中断，发生未知错误 keras 机器学习深度学习
2021-11-15 18:25

回答 2 已采纳更新下pillow看看，如果还是这样，这张图片有问题，要么是你直接改的后缀而不是通过转换，要么是这种图已经损坏了，无法读取了
python构建神经网络训练模型的问题？ python 有问必答深度学习神经网络
2021-04-11 17:39

回答 3 已采纳 input_shape=(7787,)这里是不是少了一个参数
训练过程中Loss函数出现Nan的可能原因
2020-07-03 22:52

Jacob_Y7的博客综合我做过的一些实验，记录一下实验过程中Loss出现Nan的一些可能原因：最简单的，学习率过大。 BTW, 学习率过大还可能导致收敛到一个定值之前实验室的师姐拿云图做DNI分类的结果最后都收敛到同一个数值，结果我...
一维卷积神经网络训练时遇到报错：Vexpected conv1d_input to have 3 dimensions, but got array with shape (20430, 2048) python 有问必答深度学习
2022-03-19 16:13

回答 2 已采纳 39行input_shape = (2048, 1)是说单个个样本shape，因此模型的输入数据shape应为(n, 2048, 1)，可将52行改为 model.fit(x[train].resha
用BP神经网络进行预测，loss比较小，但预测值跟实际值相差较大，怎么办 keras python 有问必答神经网络
2021-07-19 21:04

回答 1 已采纳首先怀疑过拟合, 减少迭代次数, 像这种非常简单的数据拟合, 完全不需要200这么大的周期, 一般30-50个足够
我利用torch搭建了一个神经网络但是需要神经网络的输出控制在0-1之间训练后发生了梯度消失 python 人工智能神经网络
2021-04-25 02:16

回答 1 已采纳 1. 把loss函数也放出来看看 2. 先把中间的sigmoid改成Relu（或者其他变种），最后一层使用sigmoid
Pytorch训练模型损失Loss为Nan或者无穷大（INF）原因
2022-02-12 12:20

ytusdc的博客相信很多人都遇到过训练一个deep model的过程中，loss突然变成了NaN。在这里对这个问题做一个总结： 1.如果在迭代的100轮以内，出现NaN，一般情况下的原因是因为你的学习率过高，需要降低学习率。可以不断降低学习...
cuda报错，程序不训练，acc不增长，loss为Nan python tensorflow windows
2023-04-18 11:32

回答 3 已采纳 30系显卡要求11.0以上的cuda，推荐11.7
【人工智能项目】- 卷积神经网络实现游客评价情绪鉴别
2021-11-02 19:33

mind_programmonkey的博客【人工智能项目】- 卷积神经网络实现游客评价情绪鉴别本次主要任务是对游客发表的评价内容的情绪进行鉴别，积极还是消极。 import pandas as pd import numpy as np import matplotlib.pyplot as plt import os ...
【Pytorch神经网络实战案例】20 基于Cora数据集实现图卷积神经网络论文分类
2022-03-31 10:55

LiBiGo的博客 1 案例说明（图卷积神经网络） CORA数据集里面含有每一篇论文的关键词以及分类信息，同时还有论文间互相引用的信息。搭建AI模型，对数据集中的论文信息进行分析，根据已有论文的分类特征，从而预测出未知分类的论文...
没有解决我的问题, 去提问

悬赏问题

¥15 thinkphp6配合social login单点登录问题
¥15 HFSS 中的 H 场图与 MATLAB 中绘制的 B1 场部分对应不上
¥15 如何在scanpy上做差异基因和通路富集？
¥20 关于#硬件工程#的问题，请各位专家解答！
¥15 关于#matlab#的问题：期望的系统闭环传递函数为G(s)=wn^2/s^2+2¢wn+wn^2阻尼系数¢=0.707，使系统具有较小的超调量
¥15 FLUENT如何实现在堆积颗粒的上表面加载高斯热源
¥30 截图中的mathematics程序转换成matlab
¥15 动力学代码报错，维度不匹配
¥15 Power query添加列问题
¥50 Kubernetes&Fission&Eleasticsearch

卷积神经网络训练loss变为nan

1条回答 默认 最新

悬赏问题

1条回答默认最新