多层感知机问题
我想手动的对一个三层的感知机(输入层、隐藏层、输出层)计算参数梯度,损失函数使用交叉熵损失函数,想知道一下损失L对W1、b1、W2、b2的求导公式怎么推理。
这个图片是我看的一篇论文中的对输出层参数的求导公式,我实在是没懂他这是怎么推出来的,这篇论文假定每个样本有a个特征、隐藏层大小为b,类别总数为c,Wo为输出层参数,Wh为隐藏层参数,这里的Es是交叉熵损失函数,可以当作Loss


多层感知机问题
我想手动的对一个三层的感知机(输入层、隐藏层、输出层)计算参数梯度,损失函数使用交叉熵损失函数,想知道一下损失L对W1、b1、W2、b2的求导公式怎么推理。
这个图片是我看的一篇论文中的对输出层参数的求导公式,我实在是没懂他这是怎么推出来的,这篇论文假定每个样本有a个特征、隐藏层大小为b,类别总数为c,Wo为输出层参数,Wh为隐藏层参数,这里的Es是交叉熵损失函数,可以当作Loss


关注【相关推荐】