多个输出神经元误差反向传播到一个隐藏层神经元时其梯度为0？

就像下图这样，输出之后用softmax归一，这里我用MSE举例方便（我写代码试了一下交叉熵算出来效果问题是一样的），当要优化那个隐藏层神经元的时候，要把每个输出神经元对其的偏导相加求和，然后我发现离谱的事情无论任何情况，相加后都等于0。我写代码随机初始化了所有参数，但是打印出来这个相加后的梯度永远是0，也就是说所有隐藏层神经元的任何参数都无法被更新，网上一直没有找到相关讲解，求解答！换用任何损失函数都有这个问题

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
CSDN-Ada助手 CSDN-AI 官方账号 2023-11-05 05:23
关注
【相关推荐】

这篇文章讲的很详细，请看：机器学习入门（06）— 输出层多元分类、softmax 归一化指数函数以及输出层的神经元数量

如果你已经解决了该问题, 非常希望你能够分享一下解决方案, 写成博客, 将相关链接放在评论区, 以帮助更多的人 ^-^
解决
无用 1
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

python 新手神经网络的反向传播 和误差反向传播 是同一个东西吗 tensorflow 深度学习神经网络
2019-02-12 18:00

回答 1 已采纳是的。就是根据损失函数计算的误差，用优化算法（比如梯度下降）反过来修正每一层的权重和偏置，所以叫做误差反向传播，简称反向传播。
有关反向传播期间神经元的梯度 python
2023-01-02 21:16

回答 2 已采纳这是正确的。在最大池化层的反向传播中，只有在正向传递期间达到最大值的神经元的梯度才会传递回来自下一层的梯度。所有其他神经元的梯度都被设置为零。这是因为最大池化层只保留最大值，并忽略其他所有值。因此
关于神经网络反向传播中的误差计算机器学习神经网络
2022-10-25 19:01

回答 2 已采纳给你推荐一个系列讲座bilibili：王木头学科学比较硬核，全是数学，没有代码，你要寻根究底还得去看数学
训练深度神经网络，使用反向传播算法，产生梯度消失和梯度爆炸问题的原因？
2024-04-22 22:56

叶庭云的博客训练深度神经网络，使用反向传播算法，产生梯度消失和梯度爆炸问题的原因？
Python BP神经网络两分类 反向传播代码问题 python 分类有问必答神经网络
2022-03-17 01:20

回答 2 已采纳 反向传播部分计算公式是对的吴恩达深度学习第二次作业_牛客博客带有一个隐藏层的平面数据分类解释一下，就是一个二维平面有两种不同的花色，我
人工智能神经网络反向传播问题深度学习神经网络
2023-02-14 14:10

回答 4 已采纳 W1：一个横向矩阵b1：一个列向量W2：一个横向矩阵b2：一个列向量以上回答来自ChatGPT
用BP算法完成3个输入，3个隐含，2个输出的神经网络模型的所有参数更新过程深度学习神经网络
2021-05-18 22:18

回答 1 已采纳 https://blog.csdn.net/qq_22475211/article/details/88815457?spm=1001.2014.3001.5502 这是我写的一个bp反向推导你可以
一个神经网络的梯度反向传播的计算过程
2021-09-27 22:52

papaofdoudou的博客当代领域内专家普遍认为，如果神经网络脉络可以做到模拟人脑的全部结构，轴突，树突，皮层结构等等，建立在数学上的强人工智能就会自动出现，可是真的是这样么？把DNA 拆到元素，拆到分子层面上，科学家看的头头是道...
反向输出一个字符串，为什么输出不了呢 c语言
2021-11-13 10:34

回答 1 已采纳输入用scanf("%s",a)
将一个三位数反向输出，不要前导0 c语言
2021-07-29 11:43

回答 2 已采纳 #include <stdio.h> int main() { char a[2]; /* 定义一个字符数组 */ scanf( "%
BP神经网络模型，如果要预测数据，是每一个数据都迭代N次吗？神经网络
2018-10-31 08:03

回答 2 已采纳具体要看你的程序，如果你不使用batch，那么通常的做法是把当前的权重在所有数据之上跑一次（正向传播），然后算出梯度，根据梯度修正每个隐层的权重（反向传播），这个整个的过程算一个迭代。你说的每年的
十三、机器学习进阶知识：神经网络之反向传播算法（梯度、误差反向传播算法BP）
2023-02-06 15:42

七层楼的疯子的博客本文主要介绍了神经网络的反向传播过程原理，同时对最常见的误差反向传播算法的原理及实现过程进行说明，通俗易懂，适合新手学习，附源码及实验数据集。
基于python做神经网络、深度学习需不需要自己写代码，需要写到什么程度呢？ python 有问必答深度学习神经网络
2022-05-16 13:12

回答 6 已采纳的确是很多第三方库给你去用，直接import就可以，但是问题是，如果目前出了问题，第三方库无法满足你的需求，你需要进一步修改代码你怎么办？而且这个问题在实际应用中是经常碰见的，这时候你会不会神经网络基
神经网络之误差反向传播算法推导
2021-08-22 23:21

!Polaris的博客误差反向传播算法是通过误差函数计算实际输出值与期望输出值之间的误差，把误差从最后的输出层依次传播到之前各层，最后通过调整各层连接权重与偏置达到减小误差的目的。而权重和偏置的调整一般使用梯度下降法。 ...
理解人工神经网络，感知机模型、多层前馈神经网络、BP算法（反向传播算法）、输出层和隐含层梯度下降更新权值推导过程。（西瓜书笔记）
2021-08-16 23:46

謙卑的博客理解人工神经网络，感知机模型、多层前馈神经网络、BP算法（反向传播算法）、输出层和隐含层梯度下降更新权值推导过程。（西瓜书笔记）（一）神经元模型神经网络(neural networks)：神经网络是由具有适应性的...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已结题（查看结题原因） 11月5日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 11月4日

悬赏问题

¥15 is not in the mmseg::model registry。报错，模型注册表找不到自定义模块。
¥15 安装quartus II18.1时弹出此error，怎么解决？
¥15 keil官网下载psn序列号在哪
¥15 想用adb命令做一个通话软件，播放录音
¥30 Pytorch深度学习服务器跑不通问题解决？
¥15 部分客户订单定位有误的问题
¥15 如何在maya程序中利用python编写领子和褶裥的模型的方法
¥15 Bug traq 数据包大概什么价
¥15 在anaconda上pytorch和paddle paddle下载报错
¥25 自动填写QQ腾讯文档收集表

多个输出神经元误差反向传播到一个隐藏层神经元时其梯度为0？

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新