深度学习里为何权重总是呈现正太分布

https://deephub.blog.csdn.net/article/details/109412617?utm_medium=distribute.pc_relevant.none-task-blog-2~default~BlogCommendFromMachineLearnPai2~default-11.control&dist_request_id=1330144.7821.16180346486147649&depth_1-utm_source=distribute.pc_relevant.none-task-blog-2~default~BlogCommendFromMachineLearnPai2~default-11.control

看了这位兄弟的文章，还是没能理解，当在使用ReLU激活函数时，权重依旧呈现以0为中心的正太分布。

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
码农阿豪@新空间代码工作室 Java领域优质创作者 2024-07-18 16:48
关注
让阿豪来帮你解答，本回答参考chatgpt3.5编写提供，如果还有疑问可以评论或留言
问题解答：在使用ReLU激活函数时，权重依旧呈现以0为中心的正太分布的原因主要是因为ReLU激活函数的非线性特性导致了权重更新时的梯度消失（Vanishing Gradient）或爆炸（Exploding Gradient）问题。在深度学习中，我们通常使用梯度下降算法来更新神经网络中的权重，梯度是目标函数对于权重的偏导数，而这个偏导数在更新权重的过程中非常重要。但是，当使用ReLU激活函数时，当输入为负数时，梯度为0，这意味着权重就不会更新。为了解决这个问题，可以采用一些改进的激活函数或初始化方法，例如Leaky ReLU、ELU等激活函数，或者使用Xavier初始化、He初始化等方法来初始化网络的权重。案例：
import torch import torch.nn as nn import torch.nn.functional as F # 定义一个深度神经网络模型 class MyModel(nn.Module): def __init__(self): super(MyModel, self).__init__() self.fc1 = nn.Linear(784, 256) self.fc2 = nn.Linear(256, 128) self.fc3 = nn.Linear(128, 10) def forward(self, x): x = F.relu(self.fc1(x)) x = F.relu(self.fc2(x)) x = self.fc3(x) return x # 初始化模型并打印模型参数 model = MyModel() print(model) # 打印每一层的权重分布 for name, param in model.named_parameters(): if 'weight' in name: print(name, param.data.mean(), param.data.std())

通过以上代码，可以看到在使用ReLU激活函数时，每一层的权重依旧呈现以0为中心的正太分布，这是由ReLU激活函数的特性导致的。如果需要改变权重的分布，可以尝试使用其他激活函数或初始化方法。
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

关于GradNorm（深度学习里面多任务学习的权重设计梯度归一化）代码debug错误 python 有问必答深度学习
2021-04-02 20:08

回答 4 已采纳可能跟叶子节点（最初定义的变量）有关，计算梯度的时候，只有叶子节点才会保留梯度，所有中间节点的grad在计算完backward()的时候为了节约内存都会被清除掉。建议检查最初定义的变量是否有改变。
深度学习初始化权重细节深度学习
2022-05-07 11:49

回答 1 已采纳你用的什么框架，只在训练开始初始化一次就够了，一般是默认自动的吧，好像是有不同的初始化方式，但一般不用管。
深度学习模型的问题。人工智能深度学习神经网络
2021-03-25 13:45

回答 2 已采纳只要模型结构不变，那么模型大小是一样的，只不过模型里面的超参会不一样，超参会随着数据和训练次数等因素变化。一般来说，同种类型的网络(像yolo5，有s,l,m,x四个大小的)，网络越大的效果会越好
AI人工智能中的数学基础原理与Python实战: 编程实现正态分布应用
2023-12-20 01:45

禅与计算机程序设计艺术的博客随着人工智能(AI)技术的不断发展，数据科学和机器学习等领域的应用也日益广泛。正态分布是一种非常重要的概率分布，它在许多统计学和机器学习算法中发挥着关键作用。因此，了解正态分布的数学原理和如何在Python中...
卷积在同batch里共享权重吗人工智能深度学习神经网络
2023-02-27 12:10

回答 3 已采纳该回答引用GPTᴼᴾᴱᴺᴬᴵ在卷积神经网络中，每个卷积层通常有多个滤波器（也称为卷积核或权重），每个滤波器负责从输入特征图中提取不同的特征。在进行卷积操作时，每个滤波器都会在输入特征图上进行滑动，计算
#在VS code 中导入学习后的权重出错，提示找不到权重文件， python 有问必答深度学习
2022-03-30 20:01

回答 2 已采纳你是用vscode打开了项目目录，相对路径需要相对这个项目目录，不能相对当前py文件你要相对py文件的路径，用vscode打开单独的py文件就行了或者参考在vscod
使用AdamW优化器的权重衰减大概设置成多少好人工智能深度学习计算机视觉
2023-02-23 16:07

回答 1 已采纳引用自chatgptAdamW优化器是Adam优化器的一种变体，主要是为了解决Adam优化器可能会带来的权重衰减不准确的问题。因此，AdamW优化器已经包含了权重衰减（weight decay）的功能
深度学习中的高斯分布
2023-12-14 22:38

智慧医疗探索者的博客高斯分布(Gaussian Distribution)又称正态分布(Normal Distribution)。高斯分布是一种重要的模型，其广泛应用与连续型随机变量的分布中，在数据分析领域中高斯分布占有重要地位。高斯分布是一个非常常见的连续概率...
pytorch空权重运行，按理说是随机数，为何每次运行结果相同？人工智能深度学习神经网络
2020-05-19 00:35

回答 1 已采纳这很正常。你丢硬币1000次，计算正面向上的，总是0.5，永远不会是0.1或者0.9 虽然每次都是随机的。
请问深度学习的十倍交叉实现的时候有点问题。。。想请问各位 tensorflow 深度学习自然语言处理
2020-02-18 20:43

回答 1 已采纳 https://blog.csdn.net/buziran/article/details/88732022
如何提取libsvm中SVR模型的特征权重 matlab 人工智能机器学习
2022-07-19 20:51

回答 1 已采纳已找到答案，w=model.SVs' * model.sv_coef
深度学习相关概念：权重初始化
2022-03-19 16:19

AiCharm的博客 深度学习相关概念：权重初始化1.全零初始化（×）2.随机初始化2.1 高斯分布/均匀分布2.1.1权重较小—N(0,0.01)\pmb{\mathcal{N}(0,0.01)}N(0,0.01)N(0,0.01)N(0,0.01)2.1.1权重较大—N(0,1\pmb{\mathcal{N}(0,...
yolov5用官方权重文件测试detect.py检测无响应深度学习
2023-04-03 22:29

回答 5 已采纳原因很简单，就是你的cuda版本错误了。英伟达的显卡从30系开始，就不支持cuda11.0以下的cuda版本了，你这个40系的需要安装cuda11以上的cuda版本才行。所以解决方案就是换cpu，或者
【深度学习理论】(4) 权重初始化，Batch Normalization
2022-03-19 11:47

立Sir的博客各位同学好，最近学习了CS231N斯坦福计算机视觉公开课，讲的太精彩了，和大家分享一下。 1. 权重初始化神经网络中的所有权重都能通过梯度下降和反向传播来优化和更新。现在问题来了，如果每一层的权重全部初始...
深度学习之模型权重
2023-12-14 16:51

Auto_Car6的博客在深度学习中，模型的权重（weights）是指神经网络中的参数，这些参数用于调整和学习模型的行为，以便能够对输入数据进行有效的映射和提取有用的特征。深度学习模型的权重是模型学习的核心，通过深入理解权重，你...
没有解决我的问题, 去提问

悬赏问题

¥15 metadata提取的PDF元数据，如何转换为一个Excel
¥15 关于arduino编程toCharArray()函数的使用
¥100 vc++混合CEF采用CLR方式编译报错
¥15 coze 的插件输入飞书多维表格 app_token 后一直显示错误，如何解决？
¥15 vite+vue3+plyr播放本地public文件夹下视频无法加载
¥15 c#逐行读取txt文本，但是每一行里面数据之间空格数量不同
¥50 如何openEuler 22.03上安装配置drbd
¥20 ING91680C BLE5.3 芯片怎么实现串口收发数据
¥15 无线连接树莓派，无法执行update，如何解决？（相关搜索：软件下载）
¥15 Windows11, backspace, enter, space键失灵

深度学习里为何权重总是呈现正太分布

1条回答 默认 最新

悬赏问题

1条回答默认最新