为何服从标准正态分布随机生成的权重初始值，经过5层sigmoid函数后，每一次的激活值（sigmoid输出值）都是两端多中间少

【深度学习入门基于Python的理论与实现】一书中，第六章，为何服从标准正态分布随机生成的权重初始值，经过5层sigmoid函数后，每一次的激活值（sigmoid输出值）都是两端多中间少。

书中没有细讲原因，我理解的应该是随着层数递进，越来越靠近0才对，然而各层输出值偏向几乎没怎么变化

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
不酸的甜柠檬 2023-03-24 09:55
关注
这个现象可能是由于sigmoid函数的特性所导致的。sigmoid函数具有S形状，其输出值在接近两端的位置会趋近于0或1，而在中间位置则会比较平坦，输出值接近0.5。
在神经网络的训练中，通常会对权重进行随机初始化，如果这些权重服从标准正态分布，那么初始值中有一些非常大或非常小的值可能会导致一些神经元的输出在初始阶段就趋近于0或1，这会产生梯度消失的问题。梯度消失会使得神经元的更新变得非常缓慢，导致网络无法有效地学习。
另一方面来看，如果权重的初始值都比较接近0，那么每个神经元的输出值都会比较接近0.5，因为sigmoid函数在接近0的位置和接近1的位置都会趋近于0.5。这会使得网络的输出变得比较平坦，可能会导致欠拟合的问题。
所以，权重的初始值需要在保持随机性的同时避免过大或过小，以使得每个神经元的输出值能够在中间位置附近，避免梯度消失和欠拟合问题。此外，还可以采用其他的激活函数，如ReLU等，来避免这个问题。

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

逻辑回归中的sigmoid函数为什么可以用来表示概率 python 分类回归有问必答
2022-06-08 21:52

回答 2 已采纳 sigmoid函数是一个常用的激活函数，它的表达式为它的图像为它可以把输入的连续实值转换为0到1之间的数字并输出，有两条渐近线分别为0和1，而此处0到1就表示分类的概率，它负责将神经元的输入映射
SINet语义分割，所有像素预测结果是同一个值 pytorch 深度学习计算机视觉
2022-03-08 15:10

回答 2 已采纳问题已解决如果保存的模型是多GPU训练的，则load_state_dict()之前必须使用torch.nn.DataParallel()来源https://www.cnblogs.com/tofen
想问问torch.nn.sigmoid()和torch.nn.funcitonal.sigmoid()的区别 pytorch 深度学习神经网络
2022-08-26 11:49

回答 3 已采纳 nn.Sigmoid()返回的是一个对象，torch.nn.funcitonal.sigmoid()是一个函数。nn.Sigmoid对象在其源代码中也是调用torch.nn.funcitonal.si
NN权重初始值及其对各层激活值分布的影响，权值衰减
2019-08-21 15:53

doubleslow;的博客 NN中每一个Affine层的权重参数的初始值是非常重要的，甚至会影响学习是否成功。但幸好我们已经有很多前辈总结出了比较好的初始值，以及判定一组初始值是否可以取得好的学习效果的方法。权值衰减有一种抑制过拟合，...
keras 二分类预测结果几乎全是一个值 keras python 有问必答深度学习
2021-06-18 20:41

回答 2 已采纳应该是这个吧，你训练之后得到的模型是H，prediction = H.predict(img)
我利用torch搭建了一个神经网络但是需要神经网络的输出控制在0-1之间训练后发生了梯度消失 python 人工智能神经网络
2021-04-25 02:16

回答 1 已采纳 1. 把loss函数也放出来看看 2. 先把中间的sigmoid改成Relu（或者其他变种），最后一层使用sigmoid
GAN训练生成的图像不清晰且无法辨认深度学习生成对抗网络
2022-12-23 14:36

回答 1 已采纳 loss函数弄错了吧
绘制隐藏层的激活值的分布[直方图]
2021-11-23 13:02

寅恪光潜的博客权重值的初始值不一样，对于激活层的值的分布影响很大，从而影响到神经网络是否可以正常的学习下去，对于权重值的初始值应该怎么设定为最好呢？
5.27日毕设求问，怎么绘制每一步epoch的loss图，最好能请附上程序 python 有问必答神经网络
2021-05-27 20:56

回答 2 已采纳看你用了torch，建议你直接保存loss的log图，然后用tensorboardX, import tensorboardX pip 安装就行
Tensorflow建一个神经网络，输出数据只有一个谱型，且杂乱神经网络
2018-12-12 13:59

回答 2 已采纳可以试着调整神经层的结构和模型的超参数，试着多次调整达到对每个参数的理解，建议可以先简要看看莫烦的视频教程，对各个参数有个大致了解，这是链接https://morvanzhou.github.io/
pytorch函数拟合出现的问题 pytorch 神经网络
2022-11-16 16:44

回答 4 已采纳问题出在你不应该将函数名命名为train，因为你本身继承的是nn.Module()这个类，如果你去看源码说明的话，你会发现这个类本身有个函数脚train，model.train()的意思是将模型转成训
深度学习入门-权重初始值(Xavier,He初始值，隐藏层激活函数值的分布)
2022-02-14 19:23

泥签的博客 Xavier初始值，He初始值，std=0.01，神经网络初始值问题讨论比较
Mnist两层神经网络梯度一直为零 python 神经网络
2022-08-03 19:10

回答 2 已采纳导包的代码我省略了，里面主要修改的是数据需要归一化、权重系统weight_init_std=0.01修改为了1、学习率降低(修改为0.05)。如果想做的更好一些，可以增加dropout # 显示图形
权重初始化对于激活函数的选择：随机常态分布/随机正态分布初始化(标准差为0.01或1)、Xavier(Glorot)初始化、He初始化
2021-08-19 14:46

あずにゃん的博客 tensorflow 2.0 画出model网络模型的拓扑图 ...TensorBoard视觉化网络每层权重分布、视觉化网络层结构 MSE(均方误差)、MAE(平均绝对误差) from_logits CE(Cross-Entropy)、BCE(Binary Cross-Ent...
第五章.与学习相关技巧—权重初始值(随机初始值，Xavier初始值，He初始值)
2023-02-15 16:00

归途^ω^的博客第五章.与学习相关技巧—权重初始值(随机初始值，Xavier初始值，He初始值)
最全最详细的常见激活函数总结（sigmoid、Tanh、ReLU等）及激活函数面试常见问题总结
2019-08-28 17:05

neo0o1的博客激活函数具有的特性激活函数的类别饱和激活函数Sigmoid激活函数Tanh(双曲正切函数)激活函数Sigmoid、Tanh激活函数引发的常见问题解决非饱和激活函数ReLU激活函数Leaky ReLU等变种激活函数为什么要使用激活函数？ ...
关于神经网络权重初始值的设置的研究
2022-01-05 21:30

每天学点的博客关于神经网络权重初始值的设置的研究一、权重初始值二、权重初始值会影响隐藏层的激活值分布三、Xavier初始值四、He初始值五、基于MNIST数据集的权重初始值的比较一、权重初始值 权值衰减—抑制过拟合、提高泛化...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已结题（查看结题原因） 9月2日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 3月24日

悬赏问题

¥15 GDI处理通道视频时总是带有白色锯齿
¥20 用雷电模拟器安装百达屋apk一直闪退
¥15 算能科技20240506咨询（拒绝大模型回答）
¥15 自适应 AR 模型参数估计Matlab程序
¥100 角动量包络面如何用MATLAB绘制
¥15 merge函数占用内存过大
¥15 Revit2020下载问题
¥15 使用EMD去噪处理RML2016数据集时候的原理
¥15 神经网络预测均方误差很小但是图像上看着差别太大
¥15 单片机无法进入HAL_TIM_PWM_PulseFinishedCallback回调函数

为何服从标准正态分布随机生成的权重初始值，经过5层sigmoid函数后，每一次的激活值（sigmoid输出值）都是两端多中间少

【深度学习入门基于Python的理论与实现】一书中，第六章，为何服从标准正态分布随机生成的权重初始值，经过5层sigmoid函数后，每一次的激活值（sigmoid输出值）都是两端多中间少。

书中没有细讲原因，我理解的应该是随着层数递进，越来越靠近0才对，然而各层输出值偏向几乎没怎么变化

3条回答 默认 最新

问题事件

悬赏问题

3条回答默认最新