关于使用dropout正则化，梯度下降的问题

dropout可以实现正则化可以理解。但是使用dropout，为什么梯度下降能够让网络的整体的损失函数达到最小呢？

dropout随机屏蔽了隐藏层的一些节点，根据剩下的网络，反向传播计算出的梯度，对剩下的参数进行优化。应该是使这个剩下网络的损失函数变小了，下一次循环又是使另一个剩下的网络的损失函数变小。为什么最后，整个网络的损失函数也变小了呢？变得更优了呢？

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

报告相同问题？

关注问题

深度学习有关dropout层的问题 python 深度学习神经网络自然语言处理
2020-10-24 09:58

回答 1 已采纳这个是需要自己去添加并调节drop率
LSTM模型训练过拟合问题。 python 人工智能深度学习神经网络
2020-09-15 10:21

回答 1 已采纳没办法，你的训练样本太少。增加训练样本是唯一的办法。好比吃不饱饭怎么办，不增加饭，采用稀饭掺水，少餐多顿这些办法都治标不治本。所以你看即便it大厂，也在拼命积攒数据以及人工标注数据，花费大
tensorflow.keras训练模型预测问题 keras python tensorflow
2023-03-04 11:08

回答 2 已采纳这种情况可能是由于模型在训练过程中出现了过拟合的现象。过拟合通常是指模型在训练集上表现很好，但在测试集上表现不佳的情况。在训练过程中，模型过度适应了训练集的噪声和特定的样本，从而导致了 val_los
深入理解深度学习——正则化（Regularization）：Dropout
2023-06-05 19:46

von Neumann的博客分类目录：《深入理解深度学习》总目录Dropout供了正则化一大类模型的方法，计算方便且功能强大。在第一种近似下，Dropout可以被认为是集成大量深层神经网络的实用Bagging方法。Bagging涉及训练多个模型，并在每个...
tensorflow.keras训练问题 keras python tensorflow
2023-03-05 18:39

回答 2 已采纳尝试一下调整参数吧，或者加层数试试
关于#神经网络#的问题：RuntimeError: mat1 and mat2 shapes cannot be multiplied (64x64 and 128x64) pytorch 深度学习神经网络
2023-02-08 20:16

回答 3 已采纳问题在后面的 model(data[0])，data 和 x 不匹配，设置错误. 可以打印和追踪矩阵的形状，是开始设置时就不匹配，还是中间被修改了，在哪里发生修改的。
【深度学习】使用自己写的VGG16网络训练精度不提升 pytorch 深度学习神经网络
2022-05-30 00:00

回答 2 已采纳删除最后的softmax层，在内个relu之前加归一化就好了
基于深度学习dropout 正则化技术来解决深度神经网络的过拟合问题
2020-07-26 12:03

幻风_huanfeng的博客如图所示，我们的训练集中有两类样本，分别为蓝色样本和红色样本，我们的任务是使用深度学习的方式来训练出一条决策边界来区别开这两类样本，这里我们训练出了两条决策边界，分别为黑色决策边界和绿色决策边界。...
pytorch搭建的cnn-lstm的Tensor问题 cnn python pytorch
2022-10-19 08:47

回答 1 已采纳你看下这篇博客吧, 应该有用👉 ：pytorch+cnn+lstm+词向量
对torchvison中VGG19的问题 python pytorch
2022-09-14 22:20

回答 1 已采纳具体实现就是这个feature中，
Tensorflow相关问题 python tensorflow 深度学习
2022-04-09 16:19

回答 1 已采纳感觉是len(train_data) // batch_size
pytorch入门：权重正则化，Dropout正则化，BN ，权重初始化
2021-01-20 09:38

AI路漫漫的博客权重正则化，Dropout正则化，BN ，权重初始化，机器学习基础，过拟合和欠拟合
tensorflow2.4 gpu 图像分类下训练中出现的问题 python
2022-04-18 16:27

回答 1 已采纳看样子是shuffle做的不好啊，不同batch不是同分布的，你调整一下shuffle的大小吧，或者预先打乱一下。
残差网络、Dropout正则化、Batch Normalization浅了解
2023-08-29 23:45

请让我按时毕业的博客残差网络是一种深度神经网络，它的特点是在每个卷积层后面添加了一个跳跃连接，使得输入可以...Dropout正则化可以有效地缓解梯度消失或爆炸的问题，因为它降低了网络的复杂度，使得梯度可以更容易地流动到较浅的层。
Course 2 改善深层神经网络 Week 1 L2正则化和Dropout正则化（随机失活正则化）
2019-08-22 12:11

Reanon的博客 L2正则化避免过度拟合的标准方法称为L2正则化，它包括适当修改你的成本函数，我们从原来的成本函数(1)到现在的函数(2)： (1)J=−1m∑i=1m(y(i)log⁡(a[L](i))+(1−y(i))log⁡(1−a[L](i)))J = -\frac{1}{m} \sum\...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 8月17日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 8月9日

悬赏问题

¥100 任意维数的K均值聚类
¥15 stamps做sbas-insar，时序沉降图怎么画
¥15 unity第一人称射击小游戏，有demo，在原脚本的基础上进行修改以达到要求
¥15 买了个传感器，根据商家发的代码和步骤使用但是代码报错了不会改，有没有人可以看看
¥15 关于#Java#的问题，如何解决？
¥15 加热介质是液体，换热器壳侧导热系数和总的导热系数怎么算
¥100 嵌入式系统基于PIC16F882和热敏电阻的数字温度计
¥15 cmd cl 0x000007b
¥20 BAPI_PR_CHANGE how to add account assignment information for service line
¥500 火焰左右视图、视差（基于双目相机）

关于使用dropout正则化，梯度下降的问题

0条回答 默认 最新

问题事件

悬赏问题

0条回答默认最新