神经网络实现多分类，反向传播后数据变为整数，导致梯度下降停止，能给个debug思路吗

我使用了四层神经网络实现多分类问题，激活函数使用的是ReLU函数，最后一层使用的是softmax层。在反向传播后参数的小数位置会缺失，导致梯度难以有效下降。我尝试将原本所有的list都改为numpy的矩阵形式，但没有解决，也未找到其他解决方法。有人遇到过相关问题吗？或者能否给一个修改方向？感谢。
或者说有无不让参数的小数部分被截断的方法？

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
「已注销」 2021-11-28 10:40
关注
从训练样本集中，抽取一批(batch)训练样本，通过整批数据的矩阵运算，得到这批样本损失的均值，减少更新梯度的次数提高训练效率

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

Python BP神经网络两分类 反向传播代码问题 python 分类有问必答神经网络
2022-03-17 01:20

回答 2 已采纳 反向传播部分计算公式是对的吴恩达深度学习第二次作业_牛客博客带有一个隐藏层的平面数据分类解释一下，就是一个二维平面有两种不同的花色，我
python 新手 神经网络的反向传播 和误差反向传播 是同一个东西吗 tensorflow 深度学习神经网络
2019-02-12 18:00

回答 1 已采纳是的。就是根据损失函数计算的误差，用优化算法（比如梯度下降）反过来修正每一层的权重和偏置，所以叫做误差反向传播，简称反向传播。
人工智能神经网络反向传播问题深度学习神经网络
2023-02-14 14:10

回答 4 已采纳 W1：一个横向矩阵b1：一个列向量W2：一个横向矩阵b2：一个列向量以上回答来自ChatGPT
基于CNN卷积神经网络实现mnist手写数据集识别
2022-02-23 20:49

泥签的博客 CNN理论 CNN结构卷积层卷积运算，填充步幅三维数据的运算多滤波器批处理池化层 CNN实现 im2col原理与代码卷积层与池化层的实现 CNN卷积神经网络的实现训练CNN
关于神经网络反向传播中的误差计算机器学习神经网络
2022-10-25 19:01

回答 2 已采纳给你推荐一个系列讲座bilibili：王木头学科学比较硬核，全是数学，没有代码，你要寻根究底还得去看数学
BP神经网络模型，如果要预测数据，是每一个数据都迭代N次吗？神经网络
2018-10-31 08:03

回答 2 已采纳具体要看你的程序，如果你不使用batch，那么通常的做法是把当前的权重在所有数据之上跑一次（正向传播），然后算出梯度，根据梯度修正每个隐层的权重（反向传播），这个整个的过程算一个迭代。你说的每年的
有关反向传播期间神经元的梯度 python
2023-01-02 21:16

回答 2 已采纳这是正确的。在最大池化层的反向传播中，只有在正向传递期间达到最大值的神经元的梯度才会传递回来自下一层的梯度。所有其他神经元的梯度都被设置为零。这是因为最大池化层只保留最大值，并忽略其他所有值。因此
深度学习入门（上）01（用cifar数据实现三层网络实现图片分类）
2020-03-10 22:33

shan11ok的博客 1-1深度学习入门-imagenet图像分类比赛 1-2计算机视觉面临的挑战和常规套路 1-3 K近邻进行图像分类 KNN的实现步骤 KNN总结 KNN的问题：数据库样例：测试结果最近邻实现代码 1-4 超参数与交叉验证 L1 ...
深度学习将两个网络拼接在一起，前一个作为后一个的输入，反向传播计算loss报错 python 深度学习
2022-03-09 22:31

回答 2 已采纳这个报错指你的tensor经过拼接或者维度变换之后没有加上.contiguous(),导致内存不连续，你可以在有view()，或者transpose() 之类的地方后面加上.contiguous()看
用BP算法完成3个输入，3个隐含，2个输出的神经网络模型的所有参数更新过程深度学习神经网络
2021-05-18 22:18

回答 1 已采纳 https://blog.csdn.net/qq_22475211/article/details/88815457?spm=1001.2014.3001.5502 这是我写的一个bp反向推导你可以
基于python做神经网络、深度学习需不需要自己写代码，需要写到什么程度呢？ python 有问必答深度学习神经网络
2022-05-16 13:12

回答 6 已采纳的确是很多第三方库给你去用，直接import就可以，但是问题是，如果目前出了问题，第三方库无法满足你的需求，你需要进一步修改代码你怎么办？而且这个问题在实际应用中是经常碰见的，这时候你会不会神经网络基
33个神经网络训练技巧
2019-11-28 20:27

woleto的博客很多人认为开始训练神经网络是很容易的，大量库和框架号称可以用 30 行代码段解决你的数据问题，这就给大家留下了（错误的）印象：训练神经网络这件事是非常简单的，不同模块即插即用就能搭个深度模型。简单的建模...
如何将训练好的BP神经网络模型保存并可以在其他py文件中直接调用？ python 有问必答机器学习神经网络
2021-06-09 10:53

回答 2 已采纳这个需要建立字典封装起来
pytorch-神经网络
2022-10-09 12:28

雨蛮好看的的博客介绍常见的网络，线性层，卷积层，池化，非线性，损失函数，优化器，CPUGPU训练模型套路，验证套路
神经网络学习，这33 个「炼丹」技巧需要掌握
2020-05-11 17:04

互联网工匠_草木生的博客毕业后，Karpathy 成为 OpenAI 的研究科学家，后于 2017 年 6 月加入特斯拉担任人工智能与视觉总监。今日他发布的这篇博客能为深度学习研究者们提供极为明晰的洞见，在 Twitter 上也引发了极大的关注。 1. 谁说...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 11月25日

悬赏问题

¥15 使用dify通过OpenAI 的API keys添加OpenAI模型时报了“Connection Error”错误
¥15 请帮我看一下问题出在哪里
¥15 如何解决图中的问题，localhost现实无法访问此页面
¥40 想找个软件，但我不知道怎么找到它，我甚至不知道有没有
¥15 怎么把60秒的视频时长改成显示0秒？且视频内容没有任何变化的正常播放？目的是为了解决一些平台对视频时长的要求，最好有自动处理的工具！
¥15 累加器设初值为00H
¥15 webAPI接口返回值判断
¥15 自动化测试 UI Automtion
¥20 关于#深度学习#的问题：2708）输出：邻接矩阵A 或者节点索引方式：通过随机游走或者其他方式，保持节点连接类似下图(语言-python)
¥15 win11 24h2 专业工作站版右键打印怎样删除

神经网络实现多分类，反向传播后数据变为整数，导致梯度下降停止，能给个debug思路吗

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新