修改resnet50代码时发现forward函数没用

刚开始改模型，用的是centernet网络（其中主干网络resnet）。其中resnet

class ResNet(nn.Module):
    def __init__(self, block, layers, num_classes=1000):
        self.inplanes = 64
        super(ResNet, self).__init__()
        # 512,512,3 -> 256,256,64
        self.conv1 = nn.Conv2d(3, 64, kernel_size=7, stride=2, padding=3,bias=False)
        self.bn1 = nn.BatchNorm2d(64)
        self.relu = nn.ReLU(inplace=True)
        
        # 256x256x64 -> 128x128x64
        self.maxpool = nn.MaxPool2d(kernel_size=3, stride=2, padding=0, ceil_mode=True) # change

        # 128x128x64 -> 128x128x256
        self.layer1 = self._make_layer(block, 64, layers[0])

        # 128x128x256 -> 64x64x512
        self.layer2 = self._make_layer(block, 128, layers[1], stride=2)

        # 64x64x512 -> 32x32x1024
        self.layer3 = self._make_layer(block, 256, layers[2], stride=2)

        # 32x32x1024 -> 16x16x2048
        self.layer4 = self._make_layer(block, 512, layers[3],stride=2)
   

        self.avgpool = nn.AvgPool2d(7)
        self.fc = nn.Linear(512 * block.expansion, num_classes)

       
        # 权重初始化
        for m in self.modules():
            if isinstance(m, nn.Conv2d):
                n = m.kernel_size[0] * m.kernel_size[1] * m.out_channels
                m.weight.data.normal_(0, math.sqrt(2. / n))
            elif isinstance(m, nn.BatchNorm2d):
                m.weight.data.fill_(1)
                m.bias.data.zero_()

    def _make_layer(self, block, planes, blocks,stride=1):
        downsample = None
        if stride != 1 or self.inplanes != planes * block.expansion:
            downsample = nn.Sequential(
                 nn.Conv2d(self.inplanes, planes * block.expansion,
                     kernel_size=1, stride=stride, bias=False),
            nn.BatchNorm2d(planes * block.expansion),
        )
        layers = []
        layers.append(block(self.inplanes, planes, stride, downsample))
        self.inplanes = planes * block.expansion
        for i in range(1, blocks):
            layers.append(block(self.inplanes, planes))

        return nn.Sequential(*layers)

    def forward(self, x):
        x = self.conv1(x)
 

        x = self.bn1(x)
        x = self.relu(x)
        x = self.maxpool(x)
        x = self.layer1(x)  # 128x128x64 -> 128x128x256

        x1 = self.layer2(x)    # 128x128x256 -> 64x64x512

        x2 = self.layer3(x1) # 64x64x512 -> 32x32x1024

        x3 = self.layer4(x2)# 32x32x1024 -> 16x16x2048


        x = self.avgpool(asff1_x)
        x = x.view(x.size(0), -1)
        x = self.fc(x)

        return x

我在 def forward(self, x)下面里改来改去，后面才发现这段根本没用上，因为centernet代码里

class CenterNet_Resnet50(nn.Module):
    def __init__(self, num_classes = 20, pretrained = False):
        super(CenterNet_Resnet50, self).__init__()
        #预训练→主干提取特征→解码→检测头
        self.pretrained = pretrained
        # 512,512,3 -> 16,16,2048
        self.backbone = resnet50(pretrained = pretrained)
        # 16,16,2048 -> 128,128,64

        # self.PPM=PPM(2048)
        self.decoder = resnet50_Decoder(2048)
        #-----------------------------------------------------------------#
        #   对获取到的特征进行上采样，进行分类预测和回归预测
        #   128, 128, 64 -> 128, 128, 64 -> 128, 128, num_classes
        #                -> 128, 128, 64 -> 128, 128, 2
        #                -> 128, 128, 64 -> 128, 128, 2
        #-----------------------------------------------------------------#
        self.head = resnet50_Head(channel=64, num_classes=num_classes)
        
        self._init_weights()

    def freeze_backbone(self):
        for param in self.backbone.parameters():
            param.requires_grad = False

    def unfreeze_backbone(self):
        for param in self.backbone.parameters():
            param.requires_grad = True

    def _init_weights(self):
        if not self.pretrained:
            for m in self.modules():
                if isinstance(m, nn.Conv2d):
                    n = m.kernel_size[0] * m.kernel_size[1] * m.out_channels
                    m.weight.data.normal_(0, math.sqrt(2. / n))
                elif isinstance(m, nn.BatchNorm2d):
                    m.weight.data.fill_(1)
                    m.bias.data.zero_()
        
        self.head.cls_head[-1].weight.data.fill_(0)
        self.head.cls_head[-1].bias.data.fill_(-2.19)
        
    def forward(self, x):
        feat = self.backbone(x)
 
        return self.head(self.decoder(feat))

里面主干网络调用的是：

def resnet50(pretrained = True):
    model = ResNet(Bottleneck, [3, 4, 6, 3])#第一个参数用的是bottleneck，第二个参数是每层里卷积数量
    if pretrained:
        state_dict = load_state_dict_from_url(model_urls['resnet50'], model_dir = 'model_data/')
        model.load_state_dict(state_dict)
    #----------------------------------------------------------#
    #   获取特征提取部分
    #----------------------------------------------------------#
    features = list([model.conv1, model.bn1, model.relu, model.maxpool, model.layer1, model.layer2, model.layer3, model.layer4])
    features = nn.Sequential(*features)
    return features

所以如果要修改网络（比如添加注意力什么的模块）只能修改其他地方，那这个def forward这段有什么用呢（把这段去了都能跑），如果要在这里修改的话

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

CSDN-Ada助手 CSDN-AI 官方账号 2023-10-17 07:07

关注

【以下回答由 GPT 生成】

问题分析:

根据给出的代码，可以看到ResNet类继承了nn.Module，并实现了一个初始化函数和一个_make_layer函数，但是并没有实现forward函数，这就导致了forward函数没有被调用到的问题。

解决方案:

为了解决这个问题，需要在ResNet类中添加一个forward函数，并在该函数中实现前向传播的操作。

以下是修改后的代码:

class ResNet(nn.Module):
    def __init__(self, block, layers, num_classes=1000):
        self.inplanes = 64
        super(ResNet, self).__init__()

        # 输入图像尺寸：512x512x3，输出图像尺寸：256x256x64
        self.conv1 = nn.Conv2d(3, 64, kernel_size=7, stride=2, padding=3, bias=False)
        self.bn1 = nn.BatchNorm2d(64)
        self.relu = nn.ReLU(inplace=True)

        # 256x256x64 -> 128x128x64
        self.maxpool = nn.MaxPool2d(kernel_size=3, stride=2, padding=0, ceil_mode=True)

        # 128x128x64 -> 128x128x256
        self.layer1 = self._make_layer(block, 64, layers[0])

        # 128x128x256 -> 64x64x512
        self.layer2 = self._make_layer(block, 128, layers[1], stride=2)

        # 64x64x512 -> 32x32x1024
        self.layer3 = self._make_layer(block, 256, layers[2], stride=2)

        # 32x32x1024 -> 16x16x2048
        self.layer4 = self._make_layer(block, 512, layers[3], stride=2)


        self.avgpool = nn.AvgPool2d(7)
        self.fc = nn.Linear(512 * block.expansion, num_classes)


        # 权重初始化
        for m in self.modules():
            if isinstance(m, nn.Conv2d):
                n = m.kernel_size[0] * m.kernel_size[1] * m.out_channels
                m.weight.data.normal_(0, math.sqrt(2. / n))
            elif isinstance(m, nn.BatchNorm2d):
                m.weight.data.fill_(1)
                m.bias.data.zero_()

    def _make_layer(self, block, planes, blocks, stride=1):
        downsample = None
        if stride != 1 or self.inplanes != planes * block.expansion:
            downsample = nn.Sequential(
                 nn.Conv2d(self.inplanes, planes * block.expansion,
                     kernel_size=1, stride=stride, bias=False),
                 nn.BatchNorm2d(planes * block.expansion),
            )

        layers = []
        layers.append(block(self.inplanes, planes, stride, downsample))
        self.inplanes = planes * block.expansion
        for _ in range(1, blocks):
            layers.append(block(self.inplanes, planes))

        return nn.Sequential(*layers)

    def forward(self, x):
        # 前向传播操作
        x = self.conv1(x)
        x = self.bn1(x)
        x = self.relu(x)
        x = self.maxpool(x)
        x = self.layer1(x)
        x = self.layer2(x)
        x = self.layer3(x)
        x = self.layer4(x)
        x = self.avgpool(x)
        x = torch.flatten(x, 1)
        x = self.fc(x)

        return x

通过添加forward函数，将原来分散在初始化函数和_make_layer函数中的前向传播操作串联起来，这样就可以保证forward函数被调用到了。现在可以使用修改后的ResNet模型进行计算机视觉任务了。

如果你已经解决了该问题, 非常希望你能够分享一下解决方案, 写成博客, 将相关链接放在评论区, 以帮助更多的人 ^-^

报告相同问题？

关注问题

解析ResNet50优化在AI工业缺陷检测中的应用难点
2025-07-14 01:03

AI架构师小马的博客本文将以“闯关”为线索，拆解ResNet50在工业缺陷检测中的三大核心难点——小样本泛化、实时推理效率、域偏移适应，用“接力赛”“压缩文件”“找小虫子”等生活化比喻解释技术原理，结合PyTorch代码示例和Mermaid...
通俗理解残差网络（ResNet）
2026-01-04 09:37

不惑_的博客本文介绍了残差网络（ResNet）在深度学习中的重要作用。ResNet通过引入残差块和捷径连接，有效解决了深层神经网络中的梯度消失问题，使得网络可以训练到1000多层。相比传统网络，ResNet更容易优化、泛化能力更强且...
CIFAR10训练ResNet18
2025-03-19 21:40

111…的博客由于CIFAR10数据集图片较小，...输入通道为3，输出通道为64，不进行下采样同样使用卷积+批归一化+激活函数的组合，不仅可以有效提取和转换特征，还能稳定训练过程和提升网络性能#在__init__方法中#在forward方法中。
【AI量化投研】- Modeling（二， ResNet）
2025-12-15 20:03

FinancierHuang的博客本文总结了基于Swin Transformer模型的AI量化投研建模失败案例。两次训练（5000+和3800+样本）均显示训练损失下降但验证集完全不收敛，模型未能学到有效特征。原因分析包括：1）数据质量问题（特征-标签关联弱/噪声...
AI人工智能领域神经网络的发展历程回顾
2025-06-13 23:00

AI智能探索者的博客神经网络是AI的“大脑骨架”，其发展史是一部“理论-算力-数据”的协同进化史。本文将聚焦1943年至今的关键节点，覆盖从基础模型（M-P神经元）到前沿架构（Transformer）的技术跃迁，同时解读每个阶段的“冷”与“热...
采用Resnet做UC Merced Land Use Dataset数据分类
2022-08-14 21:54

一个不会读文献的参考文献的博客用Resnet做的UC Merced Land Use Dataset数据分类
揭秘！头部大厂AI架构师的效能提升实战方案
2026-03-07 00:50

光子AI的博客本文将从痛点拆解→组件化搭建→性能优化→工程化流程→协作规范→监控迭代六个维度，完整还原头部大厂AI架构师的效能提升实战方案。如何用组件化思想将重复代码减少70%？如何用分布式训练+模型量化将训练/推理速度...
惊爆内幕！AI应用架构师分享AI模型知识蒸馏的独家诀窍
2025-09-25 14:25

AI智能架构工坊的博客而解决这个矛盾的“魔法”，正是AI架构师们藏在工具箱里的知识蒸馏（Knowledge Distillation）：让小模型“偷学”大模型的“思维方式”，用1/10的体积，换95%的性能。本文将揭开知识蒸馏的独家诀窍。
震撼！AI应用架构师带你开启AI模型压缩与加速之旅
2025-08-05 00:15

光子AI的博客答案藏在「模型压缩与加速」里——这门技术就像给AI「减肥健身」，让大模型从「笨重的大象」变成「灵活的猎豹」。本文将从问题场景为什么要压缩模型？（解决「大模型跑不动」的痛点）压缩的核心方法有哪些？（剪枝、...
一文解锁！AI应用架构师的AI系统故障诊断方案密码
2025-08-09 17:22

光子AI的博客我是张三，某大厂AI应用架构师，5年AI系统设计与运维经验，负责过3个亿级用户的AI系统（推荐、图像识别、NLP）。我的公众号“AI架构师笔记”，专注分享AI落地的实战经验——从模型设计到故障诊断，从性能优化到成本...
AI训练在AI算力网络与通信中的训练策略调整
2025-07-09 11:37

光子AI的博客随着AI模型从“小作坊”（百万参数）进化到“超级工厂”（万亿参数），算力需求呈爆炸式增长，传统集中式训练已无法应对。算力网络（云-边-端协同的分布式算力基础设施）成为解决这一问题的关键，但通信瓶颈（延迟、...
深度学习模型压缩：AI算力网络的核心技术
2025-07-10 21:41

光子AI的博客但现实是：全球70%的AI算力需求来自手机、智能摄像头、工业传感器等边缘设备（IDC 2023报告）。如何让"大而强"的模型在"小而精"的设备上高效运行？这就是深度学习模型压缩技术的使命——在保持模型性能（准确率、...
融合ResNet与GRU的端到端唇语识别系统开发实战
2025-10-17 00:14

assembly8low的博客本文详细介绍了如何开发一个融合ResNet与GRU的端到端唇语识别系统。通过结合3D ResNet提取时空特征、GRU进行时序建模，并利用Yolo实现精准唇部定位，构建了一个完整的深度学习应用。文章涵盖了从数据准备、模型训练...
智能农业的动物行为监测：AI应用架构师的未来算法设计
2025-08-09 03:47

AI云原生与云计算技术学院的博客今天，AI正在把“看猪跑”变成“懂猪心”：猪圈的摄像头能识别“异常躺卧”，智能项圈能监测“运动幅度骤降”，声音传感器能捕捉“痛苦哼叫”——这些数据通过边缘设备实时分析，5秒内就能给张叔的手机发预警：“3号...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 10月16日

修改resnet50代码时发现forward函数没用

2条回答 默认 最新

问题事件

2条回答默认最新