深度学习训练时，一开始损失值就显示nan

训练开始损失值为nan，但是用一半数据进行训练损失值就正常显示，是什么原因呢？

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
apples_kk 2023-03-30 11:03
关注
可能的原因有：

数据不全面：原始数据可能存在缺失值或者异常值，而使用较少的数据进行训练会减少数据中的特殊值，减少损失值NaN的出现。
非常大的学习率：使用较大的学习率可能会导致损失值NaN，因为学习率太大，会导致参数太过激进，从而导致训练损失值出现NaN的情况。而用较少的数据训练时可以避免这种情况。
神经网络架构设计错误：深度学习的神经网络参数设计错误会导致训练的损失值NaN。
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(2条)

报告相同问题？

关注问题

深度学习训练时，一开始损失值就显示nan python
2023-03-30 08:58

回答 3 已采纳可能的原因有：数据不全面：原始数据可能存在缺失值或者异常值，而使用较少的数据进行训练会减少数据中的特殊值，减少损失值NaN的出现。非常大的学习率：使用较大的学习率可能会导致损失值NaN，因为学习率太
YOLO v5训练使用CPU正常，使用GPU训练 box cls obj均为nan pytorch 深度学习目标检测
2022-01-15 21:21

回答 2 已采纳解决了，既然锁定问题出在显卡上，在坚信不是硬件问题的前提下，只能一遍一遍换驱动版本。刚开始用的最早的驱动版本是11.3，pytorch支持的另一个cuda版本10.2 nvidia官网不支持wind
yolov5训练损失为Nan python
2022-08-12 13:39

回答 1 已采纳将学习率改为0.00001，步子太大，扯到蛋了，改小点
如何从零开始构建深度学习项目？这里有一份详细的教程
2020-12-14 19:45

Charmve的博客在学习了有关深度学习的理论课程之后，很多人都会有兴趣尝试构建一个属于自己的项目。本文将会从第一步开始，告诉你如何解决项目开发中会遇到的各类问题。
使用Keras编写的LSTM，训练时出现loss: nan - val_loss: nan，该如何调整？ keras lstm 有问必答深度学习
2022-05-03 18:40

回答 2 已采纳原数据第一列是时间形式的20220503这种，在读数据之后进行下面操作，你的数据是简单的1 2 34这种，数据可能在处理过程丢失或者变成nan了，你可以一步步看看每次处理后当前的数据现在是什么格式 d
yolov5训练模型时遇到nan 人工智能机器学习算法
2022-12-31 20:12

回答 2 已采纳很遗憾，我无法确定你遇到的问题的原因。在没有更多的信息的情况下，我只能给出一些潜在的建议。首先，如果你发现模型使用更大的权重文件时在 GPU 上运行会导致数据全部变为 nan，可能是因为你的 GP
跑yolov5出现 nan 人工智能深度学习
2022-04-02 19:40

回答 6 已采纳这可能是PyTorch在其他一些问题中提到的Windows/conda/CUDA11错误，在这种情况下，降级到CUDA 10可以解决这个问题。或者，您的数据集标签可能存在一些问题。
深度学习模型性能指标评估方法及其应用场景
2023-07-29 01:59

禅与计算机程序设计艺术的博客然而，如何正确地衡量并选取合适的深度学习模型，以及该模型的表现是否达到预期目标，一直是一个尚待解决的问题。所以，如何对深度学习模型的性能进行准确、全面、客观地评价，是当前热门研究的一个重要方向。
Darknet yolov3训练数据，为何载入迭代200次的数据开始训练控制台却显示从100次开始运行？深度学习
2020-04-14 09:50

回答 1 已采纳我也是遇见这个问题，本来是忘记改了原来的50200，幸运的是迭代到134次时，电脑卡退了，我再重新训练时改迭代次数，发现在100以下的，用保存的最后的权重模型去训练时直接就不训练了，然后改成了150次
机器学习使用xgboost模型，报错：输入的数据有inf和nan？ python 机器学习深度学习
2023-01-29 20:23

回答 2 已采纳 XGBoost 默认是不能处理包含 inf 和 nan 的数据的，你需要先检测并处理掉数据中的无穷大或非数字值。如果数据确实包含过大的浮点数导致了此类问题，你可以考虑对数据进行对数处理来减小数值的范
vue使用乘法，页面显示nan jquery vue.js
2021-08-31 18:12

回答 1 已采纳不是一个数字把。Number(a)*Number(b)
动手学深度学习-pytorch版本（一）：引言 & 预备知识
2023-08-14 22:09

Robot_Yue的博客 深度学习的基本概念及数学基础
最后为什么会显示NaN？ javascript
2021-08-03 20:47

回答 1 已采纳 return (this.width* this.heigt) / 2; heigt 写错了，应该是height
Kaggle深度学习挑战赛——房价预测 (数据科学系列教程)
2023-09-02 12:21

禅与计算机程序设计艺术的博客幸运的是，有了深度学习框架和高效的计算能力，机器学习模型已经可以在许多领域取得惊人的成果。在过去的几年里，很多数据科学家都参加或者尝试过Kaggle竞赛。这些竞赛涉及到不少不同类型的数据处理问题，比如图像...
深度学习基础（一）
2022-11-07 22:35

用户昵称还已存在的博客 深度学习基础系列
一文梳理深度学习算法演进
2022-05-13 15:30

人工智能与算法学习的博客作者|Peter潘欣来源 |https://zhuanlan.zhihu.com/p/464515049编辑 |蘑菇先生学习记涉及...1. 前言如果说高德纳的著作奠定了第一代计算机算法，那么传统机器学习则扩展出第二代，而近十年崛起的深度学习则是传统机...
【Nan‘s 吴恩达深度学习笔记】第二课第一周 深度学习的实践层面
2020-11-30 16:47

Liareee的博客【Nan‘s 吴恩达深度学习笔记】第二课第一周 深度学习的实践层面1.1 训练，验证，测试数据集(Train / Dev / Test sets)概念表示常用划分1.2 偏差，方差（Bias/Variance）机器学习基础方法1.4 正则化（Regularization...
深入理解混合精度训练：从 Tensor Core 到 CUDA 编程
2021-12-20 15:45

旷视的博客背景近年来，自动混合精度（Auto Mixed-Precision，AMP）技术在各大深度学习训练框架中作为一种使用简单、代价低廉、效果显著的训练加速手段，被越来越广泛地应用到算法研究中。...
回顾6年深度学习算法实践和演进
2022-05-30 21:07

人工智能与算法学习的博客 01前言如果说高德纳的著作奠定了第一代计算机算法，那么传统机器学习则扩展出第二代，而近十年崛起的深度学习则是传统机器学习上进一步发展的第三代算法。深度学习算法的魅力在于它核心逻辑的简单且通用。在...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 4月8日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 3月31日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 3月30日

悬赏问题

¥15 yolov8边框坐标
¥15 matlab中使用gurobi时报错
¥15 WPF 大屏看板表格背景图片设置
¥15 这个主板怎么能扩出一两个sata口
¥15 不是，这到底错哪儿了😭
¥15 2020长安杯与连接网探
¥15 关于#matlab#的问题：在模糊控制器中选出线路信息，在simulink中根据线路信息生成速度时间目标曲线（初速度为20m/s，15秒后减为0的速度时间图像）我想问线路信息是什么
¥15 banner广告展示设置多少时间不怎么会消耗用户价值
¥16 mybatis的代理对象无法通过@Autowired装填
¥15 可见光定位matlab仿真

深度学习训练时，一开始损失值就显示nan

3条回答 默认 最新

问题事件

悬赏问题

3条回答默认最新