（解决问题追加酬谢）自己复现的resnet的deelabpv3效果差很多（与torch官方的比），不收敛，一直没找到原因，使用的数据集，train脚本都一样

（解决问题有酬谢）自己复现的resnet的deelabpv3效果差很多（与torch官方的比），不收敛，一直没找到原因，使用的数据集，train脚本都一样。


import torch.nn as nn
import torch
from torchinfo import summary
import netron
import onnx
from onnx import shape_inference

from torch.nn import functional as F


class BottleNeck(nn.Module):
    """搭建BottleNeck模块"""

    expansion = 4

    def __init__(self, in_channel, out_channel, stride, padding, dilation):
        super(BottleNeck, self).__init__()
        self.stride = stride
        self.res = nn.Sequential(
            nn.Conv2d(in_channel, out_channel * self.expansion, kernel_size=1, stride=stride, bias=False),
            nn.BatchNorm2d(out_channel * self.expansion)
            )

        self.conv1 = nn.Conv2d(in_channel, out_channel, kernel_size=1, stride=1, bias=False)
        self.bn1 = nn.BatchNorm2d(out_channel)  # BN层, BN层放在conv层和relu层中间使用
        self.conv2 = nn.Conv2d(out_channel, out_channel, kernel_size=3, stride=stride, padding=padding, bias=False,
                               dilation=dilation)
        self.bn2 = nn.BatchNorm2d(out_channel)
        self.conv3 = nn.Conv2d(out_channel, out_channel * self.expansion, kernel_size=1, stride=1, bias=False)
        self.bn3 = nn.BatchNorm2d(out_channel * self.expansion)  # Residual中第三层out_channel扩张到in_channel的4倍
        self.relu = nn.ReLU(inplace=True)

    # 前向传播
    def forward(self, x):
        identity = x
        out = self.conv1(x)
        out = self.bn1(out)
        out = self.relu(out)
        out = self.conv2(out)
        out = self.bn2(out)
        out = self.relu(out)
        out = self.conv3(out)
        out = self.bn3(out)

        # out = self.relu(self.bn1(self.conv1(x)))
        # out = self.relu(self.bn2(self.conv2(out)))
        # out = self.bn3(self.conv3(out))

        identity = self.res(identity)

        out = self.relu(identity + out)

        return out


class BottleNeck1(nn.Module):  # 无残差结构的，因为发现torch的deeplabv3_resnet50结构只有layer中第一层bottleneck需要卷积残差，其他层直接加就可以
    """搭建BottleNeck模块"""

    expansion = 4

    def __init__(self, in_channel, out_channel, stride, padding, dilation):
        super(BottleNeck1, self).__init__()

        self.conv1 = nn.Conv2d(in_channel, out_channel, kernel_size=1, stride=1, bias=False)
        self.bn1 = nn.BatchNorm2d(out_channel)  # BN层, BN层放在conv层和relu层中间使用
        self.conv2 = nn.Conv2d(out_channel, out_channel, kernel_size=3, stride=stride, padding=padding, bias=False,
                               dilation=dilation)
        self.bn2 = nn.BatchNorm2d(out_channel)
        self.conv3 = nn.Conv2d(out_channel, out_channel * self.expansion, kernel_size=1, stride=1, bias=False)
        self.bn3 = nn.BatchNorm2d(out_channel * self.expansion)  # Residual中第三层out_channel扩张到in_channel的4倍
        self.relu = nn.ReLU(inplace=True)

    # 前向传播
    def forward(self, x):
        identity = x.clone()

        out = self.conv1(x)
        out = self.bn1(out)
        out = self.relu(out)
        out = self.conv2(out)
        out = self.bn2(out)
        out = self.relu(out)
        out = self.conv3(out)
        out = self.bn3(out)

        # out = self.relu(self.bn1(self.conv1(x)))
        # out = self.relu(self.bn2(self.conv2(out)))
        # out = self.bn3(self.conv3(out))

        out = self.relu(identity + out)
        return out


class Branch(nn.Module):

    def __init__(self, in_channel, out_channel, kernel_size, dilation, padding):
        super(Branch, self).__init__()

        self.conv1 = nn.Conv2d(in_channel, out_channel, kernel_size=kernel_size, padding=padding, dilation=dilation, stride=1, bias=False)
        self.bn1 = nn.BatchNorm2d(out_channel)  # BN层, BN层放在conv层和relu层中间使用
        self.relu = nn.ReLU(inplace=True)

    def forward(self, x):
        out = self.relu(self.bn1(self.conv1(x)))
        return out

class ASPPPooling(nn.Module):
    def __init__(self, in_channels, out_channels):
        super(ASPPPooling, self).__init__()
        self.conv1 = nn.Sequential(
                    nn.AdaptiveAvgPool2d(1),
                    nn.Conv2d(in_channels, out_channels, 1, bias=False),
                    nn.BatchNorm2d(out_channels),
                    nn.ReLU()
        )

    def forward(self, x):
        size = x.shape[-2:]
        out = self.conv1(x)
        out = F.interpolate(out, size=size, mode='bilinear', align_corners=False)
        return out


class Deeplab(nn.Module):

    def __init__(self, numberclass):  # in_channel=out_channel=64
        super(Deeplab, self).__init__()
        self.conv1 = nn.Sequential(nn.Conv2d(3, 64, kernel_size=7, stride=2, padding=3, bias=False),
                                   nn.BatchNorm2d(64),
                                   nn.ReLU()
                                   )
        self.polling = torch.nn.MaxPool2d(kernel_size=3, stride=2, padding=1, dilation=1, ceil_mode=False)
        self.laye1backbone1 = BottleNeck(64, 64, stride=1, dilation=1, padding=1)
        self.laye1backbone2 = BottleNeck1(256, 64, stride=1, dilation=1, padding=1)
        self.laye1backbone3 = BottleNeck1(256, 64, stride=1, dilation=1, padding=1)

        self.laye2backbone1 = BottleNeck(256, 128, stride=2, dilation=1, padding=1)
        self.laye2backbone2 = BottleNeck1(512, 128, stride=1, dilation=1, padding=1)
        self.laye2backbone3 = BottleNeck1(512, 128, stride=1, dilation=1, padding=1)
        self.laye2backbone4 = BottleNeck1(512, 128, stride=1, dilation=1, padding=1)

        self.laye3backbone1 = BottleNeck(512, 256, stride=1, dilation=1, padding=1)
        self.laye3backbone2 = BottleNeck1(1024, 256, stride=1, dilation=2, padding=2)
        self.laye3backbone3 = BottleNeck1(1024, 256, stride=1, dilation=2, padding=2)
        self.laye3backbone4 = BottleNeck1(1024, 256, stride=1, dilation=2, padding=2)
        self.laye3backbone5 = BottleNeck1(1024, 256, stride=1, dilation=2, padding=2)
        self.laye3backbone6 = BottleNeck1(1024, 256, stride=1, dilation=2, padding=2)

        self.laye4backbone1 = BottleNeck(1024, 512, stride=1, dilation=2, padding=2)
        self.laye4backbone2 = BottleNeck1(2048, 512, stride=1, dilation=4, padding=4)
        self.laye4backbone3 = BottleNeck1(2048, 512, stride=1, dilation=4, padding=4)
        self.branch1 = Branch(2048, 256, kernel_size=1, padding=0, dilation=1)
        self.branch2 = Branch(2048, 256, kernel_size=3, padding=12, dilation=12)
        self.branch3 = Branch(2048, 256, kernel_size=3, padding=24, dilation=24)
        self.branch4 = Branch(2048, 256, kernel_size=3, padding=36, dilation=36)
        self.branch5 = ASPPPooling(2048, 256)
        self.result = nn.Sequential(nn.Conv2d(256 * 5, 256, 1, bias=False),
                                    nn.BatchNorm2d(256),
                                    nn.ReLU(),
                                    nn.Dropout(0.5)
                                    )

        self.result1 = nn.Sequential(nn.Conv2d(256, 256, 3, padding=1, bias=False),
                                     nn.BatchNorm2d(256),
                                     nn.ReLU()
                                     )
        self.final = nn.Conv2d(256, numberclass, 1, padding=0, bias=False)

    def forward(self, x):
        out = self.conv1(x)
        out = self.polling(out)
        out = self.laye1backbone1(out)
        out = self.laye1backbone2(out)
        out = self.laye1backbone3(out)
        out = self.laye2backbone1(out)
        out = self.laye2backbone2(out)
        out = self.laye2backbone3(out)
        out = self.laye2backbone4(out)
        out = self.laye3backbone1(out)
        out = self.laye3backbone2(out)
        out = self.laye3backbone3(out)
        out = self.laye3backbone4(out)
        out = self.laye3backbone5(out)
        out = self.laye3backbone6(out)
        out = self.laye4backbone1(out)
        out = self.laye4backbone2(out)
        out = self.laye4backbone3(out)
        out1 = self.branch1(out)
        out2 = self.branch2(out)
        out3 = self.branch3(out)
        out4 = self.branch4(out)
        out5 = self.branch5(out)
        out = self.result(torch.cat((out1, out2, out3, out4, out5), 1))
        out = self.result1(out)
        out = self.final(out)
        out = F.interpolate(out, size=x.shape[-2:], mode='bilinear', align_corners=False)

        return out

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

6条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
技术宅program 2023-07-18 11:49
关注
你用的自己训练数据和训练脚本，这是问题所在，你的超参数，数据增强不足等都是原因

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

pytorch的resnet猫狗大战跑不完不收敛 python pytorch 机器学习
2022-07-22 12:31

回答 3 已采纳跑得慢是因为没有使用cuda加速
Pytorch用自己的数据训练ResNet后写测试代码是遇到问题 python 开发语言有问必答
2023-02-15 15:50

回答 2 已采纳如果你训练好ResNet模型后，需要进行模型的测试和评估。一般情况下，测试代码会有以下步骤：1、导入测试数据集：在测试代码中，你需要导入测试数据集，它应该和你训练模型时使用的数据集是相同的。2、加载模
基于在SSD目标检测使用yolov3，squeezenet，resnet50在目标检测上的使用神经网络算法计算机视觉
2023-03-03 18:37

回答 1 已采纳小魔女参考了bing和GPT部分内容调写:YOLOv3、SqueezeNet和ResNet50都是深度学习算法，它们在SSD目标检测中的使用可以提高检测的准确率和性能。YOLOv3是一种快速的目标检测
【RT-DETR有效改进】带你分析如何确定改进的基础模型，解决模型无法收敛精度很差的问题(ResNet官方一比一复现)
2024-01-12 05:33

Snu77的博客旨在为大家解决为什么用v8的仓库训练的时候模型不收敛，精度差的离谱的问题，我也是成功的找到了解决方案，对于ultralytics仓库进行多处改进从而让其还原RT-DETR官方的实验环境从而达到一比一的效果。其次我也将RT-...
ssd的backbone为resnet时，增加并行分支结构会不会有效果？机器学习深度学习目标检测
2022-08-30 14:18

回答 1 已采纳不一定。RepVGG中所说，采用多分支结构比单分支结构精度高一些，那是在重构后参数相同的条件下才有效。backbone级别的并行分支肯定不会增加精度，同样的数据下，参数更多了。你可以考虑使用更大的ba
No such file or directory: 'saved_model_weight/resnet34_pretrain_ori_low_torch_version.pth' python pytorch 深度学习
2022-07-13 22:40

回答 2 已采纳 FileNotFoundError: [Errno 2] No such file or directory: 'saved_model_weight/resnet34_pretrain_ori_lo
为什么同样的程序，笔记本训练的收敛速度会比服务器上的差？ tensorflow 深度学习
2019-10-12 18:37

回答 1 已采纳这个和你的batch size，硬件训练的性能，是否用gpu加速都有一定的关系。
神经网络学习小记录20——ResNet50模型的复现详解
2019-10-28 22:28

Bubbliiiing的博客神经网络学习小记录20——ResNet50模型的复现详解学习前言什么是残差网络什么是ResNet50模型ResNet50网络部分实现代码图片预测学习前言最近看yolo3里面讲到了残差网络，对这个网络结构很感兴趣，于是了解到这个...
有没有研究过resnet的大神，帮我解决一下测试代码的问题，错误和程序如下图，谢谢了，急求 python
2021-04-23 18:32

回答 1 已采纳从出错的信息看, resnet34只接收0到2个位置参数，你传递了3个，所以报错。
pytorch官网给的resnet程序跑不通 pytorch 人工智能深度学习
2022-03-21 08:30

回答 1 已采纳提示不是说了吗，需要切换函数的API，你用的函数是旧版本的，需要切换到新版本去，报错提示里面也跟你说了要切换哪些什么函数了
关于pytorch网站上官方实现fcn网络的问题 pytorch 深度学习
2022-04-11 11:22

回答 1 已采纳低版本可手动安装，是否兼容可自行尝试 path '/data/VOCdevkit\VOC2012' does not exist. 报错是文件位置不对，你已经找到在哪里改了，可将--data-path
[ 图像分类 ] 经典网络模型4——ResNet 详解与复现
2022-04-12 16:12

Horizon John的博客 [ 图像分类 ] 经典网络模型4——ResNet 详解与复现 1、Residual Network 2、残差网络 3、Residual Block 4、ResNet50 详解 5、ResNet50 复现 6、ResNet50 结构框图 Residual Network 简称 ResNet (残差网络)，何凯明...
resnet18函数用法 python 有问必答
2022-12-26 20:44

回答 2 已采纳 ResNet18的基本含义是，网络的基本架构是ResNet，网络的深度是18层，里面的10和3应该是按情况设定的输入和输出维度详细可参考
pytorch-resnet18和resnet50官方预训练模型
2018-08-22 09:39

pytroch官网提供的预训练模型：resnet18：resnet18-5c106cde.pth和resnet50：resnet50-19c8e357.pth（两个文件打包在一起）
Resnet50 pytorch复现
2022-03-28 22:10

kui9702的博客之前复现过Resnet18，今天复现与Resnet网络结构稍有不同的Resnet50 Resnet50的基本结构是1x1卷积->3x3卷积->1x1卷积。而每一组卷积是这样的结构：卷积->BN->RELU组合而成。如果所示，上面左边的为...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已结题（查看结题原因） 7月18日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 7月18日

悬赏问题

¥15 poi合并多个word成一个新word,原word中横版没了.
¥15 【火车头采集器】搜狐娱乐这种列表页网址，怎么采集？
¥15 求MCSCANX 帮助
¥15 机器学习训练相关模型
¥15 Todesk 远程写代码 anaconda jupyter python3
¥15 我的R语言提示去除连锁不平衡时clump_data报错，图片以下所示，卡了好几天了，苦恼不知道如何解决，有人帮我看看怎么解决吗？
¥15 在获取boss直聘的聊天的时候只能获取到前40条聊天数据
¥20 关于URL获取的参数，无法执行二选一查询
¥15 液位控制，当液位超过高限时常开触点59闭合，直到液位低于低限时，断开
¥15 marlin编译错误，如何解决？

（解决问题追加酬谢）自己复现的resnet的deelabpv3效果差很多（与torch官方的比），不收敛，一直没找到原因，使用的数据集，train脚本都一样

6条回答 默认 最新

问题事件

悬赏问题

6条回答默认最新