RepVGG代码中sgd_optimizer()的作用是什么？

在RepVGG官方代码的train.py中，没看懂这个函数在干什么：

def sgd_optimizer(model, lr, momentum, weight_decay, use_custwd):
    params = []
    for key, value in model.named_parameters():  # key是网络层名称，value是参数
        if not value.requires_grad:
            continue
        apply_weight_decay = weight_decay
        apply_lr = lr
        if (use_custwd and ('rbr_dense' in key or 'rbr_1x1' in key)) or 'bias' in key or 'bn' in key:
            apply_weight_decay = 0
            print('set weight decay=0 for {}'.format(key))
        if 'bias' in key:
            apply_lr = 2 * lr  # Just a Caffe-style common practice. Made no difference.
        params += [{'params': [value], 'lr': apply_lr, 'weight_decay': apply_weight_decay}]
    optimizer = torch.optim.SGD(params, lr, momentum=momentum)
    return optimizer
```python

```

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
herosunly 优质创作者: python技术领域 2022-07-30 18:24
关注
获得1.85元问题酬金

针对不同的层设置学习率(lr)、momentum(动量)和weight_decay(权重衰减)，然后使用SGD算法对整个网络进行优化。

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

【YOLO11改进 - 特征融合】利用YOLOv9中的RepNCSPELAN4模块替代C3k2
2024-11-25 22:29

YOLO大师的博客【YOLO11改进 - 特征融合】利用YOLOv9中的RepNCSPELAN4模块替代C3k2
深度学习学习路线图：从MNIST到MobileNetV4，从理论到实践的完整指南
2025-09-24 15:57

程序边界的博客化繁为简：先以通俗语言阐释复杂概念，再辅以数学公式与视觉图解深入解析。实践导向：引导读者动手实现模型的初级版本。配套资源丰富：提供教师课件、习题及Python Notebook编程练习。适用读者：适合已掌握应用数学...
【YOLOv11改进 - 特征融合】 GELAN:YOLOV9 通用高效层聚合网络，高效且涨点
2024-10-26 16:58

YOLO大师的博客文章目录 YOLOv11目标检测创新改进与实战案例专栏介绍摘要文章链接基本原理核心代码 YOLOv11引入代码注册步骤1: 步骤2 配置yolov11-GELAN.yaml 实验脚本结果介绍摘要当前的深度学习方法主要关注如何设计...
基于RetinaNet的配网设备状态识别与分类_R101_FPN_MS-640-800-3x_COCO模型
2026-01-06 17:45

kisshuan12396的博客定义优化器 optimizer = optim.SGD(model.parameters(), lr=config['learning_rate'], momentum=config['momentum'], weight_decay=config['weight_decay']) # 15. 学习率调度器 scheduler = optim.lr_scheduler....
睿智的目标检测61——Pytorch搭建YoloV7目标检测平台
2022-09-26 22:40

Bubbliiiing的博客看了这幅图大家应该明白为什么我把这个模块称为多分支堆叠模块，因为在该模块中，最终堆叠模块的输入包含多个分支，左一为一个卷积标准化激活函数，左二为一个卷积标准化激活函数，右二为三个卷积标准化激活函数，...
MMClassification配置文件详解与实践
2025-12-26 14:21

BE东欲的博客 MMClassification配置文件详解与实践在深度学习项目中，一个清晰、灵活且可复现的实验配置系统，往往决定了研发效率和协作质量。OpenMMLab 系列工具之所以能在学术界和工业界广泛流行，其背后强大的模块化设计功底...
睿智的目标检测——Pytorch搭建YoloV7-OBB旋转目标检测平台
2023-02-05 15:08

_白鹭先生_的博客看了这幅图大家应该明白为什么我把这个模块称为多分支堆叠模块，因为在该模块中，最终堆叠模块的输入包含多个分支，左一为一个卷积标准化激活函数，左二为一个卷积标准化激活函数，右二为三个卷积标准化激活函数，...
YOLOv11 改进 - 特征融合 | 替换 C3k2 涨点：GELAN 融合 CSP+ELAN 提精度
2025-11-19 21:43

魔改工程师的博客本文介绍了可编程梯度信息（PGI）和广义高效层聚合网络（GELAN）与 YOLOv11 的结合，以解决...我们将 GELAN 代码集成进 YOLOv11，实验脚本显示，结合 GELAN 的 YOLOv11 在 MS COCO 数据集目标检测任务中或有良好表现。
DL基础知识
2022-02-14 17:10

henyaoyuancc的博客又叫layer normalization层归一化，一般用在nlp中。LN的主要思想是:是在每一个样本(一个样本里的不同通道)上计算均值和方差，而不是 BN 那种在批方向计算均值和方差！看源码我们也可以看出来，其中outputs的shape=...
睿智的目标检测63——Tensorflow2搭建YoloV7目标检测平台
2022-11-06 23:52

Bubbliiiing的博客看了这幅图大家应该明白为什么我把这个模块称为多分支堆叠模块，因为在该模块中，最终堆叠模块的输入包含多个分支，左一为一个卷积标准化激活函数，左二为一个卷积标准化激活函数，右二为三个卷积标准化激活函数，右...
睿智的目标检测——Pytorch搭建YoloV7-Tiny-OBB旋转目标检测平台
2023-02-17 20:15

_白鹭先生_的博客看了这幅图大家应该明白为什么我把这个模块称为多分支堆叠模块，因为在该模块中，最终堆叠模块的输入包含多个分支，左一为一个卷积标准化激活函数，左二为一个卷积标准化激活函数，右二为三个卷积标准化激活函数，...
睿智的目标检测62——Keras搭建YoloV7目标检测平台
2022-10-24 22:45

Bubbliiiing的博客看了这幅图大家应该明白为什么我把这个模块称为多分支堆叠模块，因为在该模块中，最终堆叠模块的输入包含多个分支，左一为一个卷积标准化激活函数，左二为一个卷积标准化激活函数，右二为三个卷积标准化激活函数，...
清华&旷视：RepVGG，平衡速度和精度的更优解！编程
2023-08-13 20:00

技术探宝的博客 RepVGG模型是一种基于VGG模型的改进版本，通过引入一种重复卷积结构来实现更快速的推理和训练速度。这一结构的核心思想是将原本复杂的卷积层转化为简单的卷积块，从而减少计算量。与传统的VGG模型相比，RepVGG模型在...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 8月7日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
请采纳用户回复 8月2日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 7月30日

RepVGG代码中sgd_optimizer()的作用是什么？

2条回答 默认 最新

问题事件

2条回答默认最新