即改动主干网络又要使用预训练模型参数改怎么办

centernet模型使用resnet50作为主干网络，但是我在修改模型时增加了一层特征融合：


class ResNet(nn.Module):
    def __init__(self, block, layers, num_classes=1000):
        self.inplanes = 64
        super(ResNet, self).__init__()
        # 512,512,3 -> 256,256,64
        self.conv1 = nn.Conv2d(3, 64, kernel_size=7, stride=2, padding=3,bias=False)
        self.bn1 = nn.BatchNorm2d(64)
        self.relu = nn.ReLU(inplace=True)
      
 
    
        #ASFF
        self.asff=ASFF(0,2)#两个参数：返回第一层的尺寸；尺寸放大两倍

        # 256x256x64 -> 128x128x64
        self.maxpool = nn.MaxPool2d(kernel_size=3, stride=2, padding=0, ceil_mode=True) # change

        # 128x128x64 -> 128x128x256
        self.layer1 = self._make_layer(block, 64, layers[0])

        # 128x128x256 -> 64x64x512
        self.layer2 = self._make_layer(block, 128, layers[1], stride=2)

        # 64x64x512 -> 32x32x1024
        self.layer3 = self._make_layer(block, 256, layers[2], stride=2)

        # 32x32x1024 -> 16x16x2048
        self.layer4 = self._make_layer(block, 512, layers[3],stride=2)
     

        self.avgpool = nn.AvgPool2d(7)
        self.fc = nn.Linear(512 * block.expansion, num_classes)
        #把通道变成16*16*128
        self.to16_16_128=nn.Sequential( nn.Conv2d(512, 128,
                     kernel_size=1, stride=1,padding=0),)
      
        # 权重初始化
        for m in self.modules():
            if isinstance(m, nn.Conv2d):
                n = m.kernel_size[0] * m.kernel_size[1] * m.out_channels
                m.weight.data.normal_(0, math.sqrt(2. / n))
            elif isinstance(m, nn.BatchNorm2d):
                m.weight.data.fill_(1)
                m.bias.data.zero_()

    # 第一个参数表示是bottleneck类，第二个表示该block的输出channel，第三个表示每个block包含多少残差，对应下面的[3, 4, 6, 3]
    def _make_layer(self, block, planes, blocks,stride=1):
        downsample = None
        if stride != 1 or self.inplanes != planes * block.expansion:
            downsample = nn.Sequential(
                 nn.Conv2d(self.inplanes, planes * block.expansion,
                     kernel_size=1, stride=stride, bias=False),

            nn.BatchNorm2d(planes * block.expansion),
        )
        layers = []
        layers.append(block(self.inplanes, planes, stride, downsample))
        self.inplanes = planes * block.expansion
        for i in range(1, blocks):
            layers.append(block(self.inplanes, planes))

        return nn.Sequential(*layers)
    def forward(self, x):
        x = self.conv1(x)
        x = self.bn1(x)
        x = self.relu(x)
        x = self.maxpool(x)
        x = self.layer1(x)  # 128x128x64 -> 128x128x256

        x1 = self.layer2(x)    # 128x128x256 -> 64x64x512

        x2 = self.layer3(x1) # 64x64x512 -> 32x32x1024

        x3 = self.layer4(x2)# 32x32x1024 -> 16x16x2048

        x_asff=self.asff([x1,x2,x3])#将三种特征图融合

原来返回的是layer4前的几层，对应匹配了预训练模型的各个层参数：

def resnet50(pretrained = True):
    model = ResNet(Bottleneck, [3, 4, 6, 3])#第一个参数用的是bottleneck，第二个参数是每层里卷积数量
    if pretrained:
        state_dict = load_state_dict_from_url(model_urls['resnet50'], model_dir = 'model_data/')#导入预训练参数
        model.load_state_dict(state_dict)#用预训练的模型参数来初始化你构建的网络结构
    # #----------------------------------------------------------#
     #   获取特征提取部分
    # #----------------------------------------------------------#
    features = list([model.conv1, model.bn1, model.relu, model.maxpool, model.layer1, model.layer2, model.layer3, model.layer4])
    features = nn.Sequential(*features)

不知道现在加了一层后，怎么修改feature=list里，使得原来的预训练参数也可以用？
我现在是直接把最后两句改为return mdoel 导致训练时主干网络的预训练参数都用不上，收敛到以前的程度要更多世代

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

lIlIlllllIII 2023-10-23 14:56

关注

过滤更新一下只加载与预训练模型结构相匹配的参数，而不加载新加入的特征融合层的参数我稍微改了一下你看看能不能运行

def resnet50(pretrained=True):
    model = ResNet(Bottleneck, [3, 4, 6, 3])#第一个参数用的是bottleneck，第二个参数是每层里卷积数量

    if pretrained:
        # 加载预训练的权重
        state_dict = load_state_dict_from_url(model_urls['resnet50'], model_dir='model_data/')#导入预训练参数

        # 获取当前模型的状态字典
        model_dict = model.state_dict()

        # 过滤预训练权重，只更新存在的部分
        state_dict = {k: v for k, v in state_dict.items() if k in model_dict}

        # 更新模型状态字典并加载
        model_dict.update(state_dict)
        model.load_state_dict(model_dict)#用预训练的模型参数来初始化你构建的网络结构

    # #----------------------------------------------------------#
     #   获取特征提取部分
    # #----------------------------------------------------------#
    # 假设您的ResNet模型中有一个名为feature_xxxxx的属性
    features = list([model.conv1, model.bn1, model.relu, model.maxpool, model.layer1, model.layer2, model.layer3, model.layer4, model.feature_xxxxx])
    features = nn.Sequential(*features)

本回答被题主选为最佳回答 , 对您是否有帮助呢?

查看更多回答(1条)

报告相同问题？

关注问题

pytorch 模型在GPU上但训练时仍使用CPU python 有问必答神经网络
2021-05-13 18:05

回答 3 已采纳你要安装cuda和cudnn，参考一下https://zhuanlan.zhihu.com/p/106133822
关于MINIST的GAN网络中归一化参数修改的问题 python 人工智能
2021-10-21 20:18

回答 1 已采纳 sigmoid和和tanh两个函数虽然都是[0, 1]，但是你会发现他们的导数是不一样的，tanh的导数范围是[-1, 1], 而sigmoid的导数范围是[0, 0.25]，在反向传播的时候，sig
运行FairMOT demo的时候出现预训练网络权重问题，请问具体该如何调整？ python
2020-09-15 21:20

回答 3 已采纳在models下面有一些pth文件就是权重，但是一般来说不直接修改权重而是让它训练权重有一个cfg目录下，有json，这些是超参数，可以修改的
pytorch中加入注意力机制（CBAM），以ResNet为例。到底要不要用ImageNet预训练？如何加预训练参数？
2019-12-25 11:00

初识-CV的博客只保留预训练模型中，自己建的model有的参数 model_dict.update(pretrained_dict) # 将预训练的值，更新到自己模型的dict中 model.load_state_dict(model_dict) # model加载dict中的数据，更新网络的初始值或者按照...
最新版的postmanHeader参数不能修改 postman
2022-07-26 08:06

回答 1 已采纳你将前面的勾勾取消掉呢，下面另外写参数呢
scordcardpy评分卡模型改动 python 开发语言机器学习
2023-03-07 10:54

回答 1 已采纳 “Devil组”引证GPT后的撰写： 'TabularPredictor'对象没有'coef_'属性，这可能是由于你替换了scikit-learn的线性回归模型（具有'coef_'属性）为autogl
python这里修改哪几处可以改动这些元素，就是删除和修改，然后又保存到原txt中 python 有问必答
2021-12-01 20:04

回答 2 已采纳应该是转义字符原因导致输入与列表元素匹配不上。将列表中元素中换行符去掉。这样改一下即可: a=['666\n','888\n','999\n','111\n','222\n'] a=[x.strip(
修改模型后载入预训练权重
2022-09-18 15:49

翰墨大人的博客模型修改载入权重
神经网络模型预测二手车价格如何给每条数据按照时间循序赋予一定的权重神经网络
2021-07-01 10:27

回答 1 已采纳把回归看做分类问题，对loss进行权重设置即可
C++使用链表，无法正常修改记事本文件 c++
2022-12-23 11:32

回答 1 已采纳修改了下 #include <stdio.h> #include <malloc.h> #include <string.h> struct Book // 声明结
修改电脑的hosts文件，但无法通过浏览器访问域名 http 服务器网络协议
2022-04-19 10:54

回答 2 已采纳你解析的是www.luoxin88.com 你访问的是http://www.luoxin.com/ 这都不是同一个域名呀
ImageNet预训练参数和随机初始化参数训练效果对比
2019-07-04 16:36

初识-CV的博客他们所针对的是当前计算机视觉研究中的一种常规操作：管它什么任务，拿来ImageNet预训练模型，迁移学习一下。但是，预训练真的是必须的吗？这篇重新思考ImageNet预训练（Rethinking ImageNet Pre-training）就给出...
windows10 修改注册表会产生日志吗？系统安全网络安全
2021-11-12 16:56

回答 1 已采纳 Win10系统只要在操作的过程中，都会产生一些相应的操作日志的；但要监控入侵要一些安全基础，可以打开控制面板——管理工具——事件查看器——Windows日志。然后分析日志中的异常操作，或者根据你知道
使用 Timm 库替换 YOLOv8 主干网络 | 1000+ 主干融合YOLOv8
2023-12-13 23:04

迪菲赫尔曼的博客 YOLOv8 替换1000+ 主干网络！！！
自然语言处理NLP——ERNIE-M：基于回译机制的“预训练-微调”多语言模型
2022-12-01 21:51

@李忆如的博客本篇博客主要介绍一种基于回译机制的预训练-微调多语言模型——ERNIE-M。
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 1月4日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 12月27日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 10月23日

悬赏问题

¥15 单纯型python实现编译报错
¥15 c++2013读写oracle
¥15 c++ gmssl sm2验签demo
¥15 关于模的完全剩余系(关键词-数学方法)
¥15 有没有人懂这个博图程序怎么写，还要跟SFB连接，真的不会，求帮助
¥15 PVE8.2.7无法成功使用a5000的vGPU，什么原因
¥15 is not in the mmseg::model registry。报错，模型注册表找不到自定义模块。
¥15 安装quartus II18.1时弹出此error，怎么解决？
¥15 keil官网下载psn序列号在哪
¥15 想用adb命令做一个通话软件，播放录音

即改动主干网络又要使用预训练模型参数改怎么办

2条回答 默认 最新

问题事件

悬赏问题

2条回答默认最新