深度学习残差模块模型

利用CNN模型编写含三层残差模块模型，添加一行卷积层之后报错

import torch
from torch import nn
from torch.utils.data import DataLoader
from torchvision import datasets, transforms
from torch.nn import functional as F
import matplotlib.pyplot as plt

# 设定下载参数
transform = transforms.Compose([
    transforms.ToTensor(), 
    transforms.Normalize(0.1307, 0.3081)
])
# 下载训练集与测试集
train_Data = datasets.MNIST(
    root = 'D:/Jupyter/dataset/mnist/', 
    train = True, 
    download = True, 
    transform = transform
)
test_Data = datasets.MNIST(
    root = 'D:/Jupyter/dataset/mnist/', 
    train = False, 
    download = True, 
    transform = transform
)

train_loader = DataLoader(train_Data, shuffle=True, batch_size=64)
test_loader  = DataLoader(test_Data, shuffle=False, batch_size=64)

loss_list = []
accuracy_list = []
epoch_list = []

class ResidualBlock(nn.Module):
    def __init__(self,channels):
        super(ResidualBlock, self).__init__()
        self.channels = channels
        self.conv1 = nn.Conv2d(channels, channels, kernel_size=3, padding=1)
        self.conv2 = nn.Conv2d(channels, channels, kernel_size=3, padding=1)
        self.conv3 = nn.Conv2d(channels, channels, kernel_size=3, padding=1)
        
    def forward(self, x):
        y = F.relu(self.conv1(x))
        y = self.conv2(y)
        return F.relu(x + y)

class Net(nn.Module):
    def __init__(self):
        super(Net, self).__init__()
        self.conv1 = nn.Conv2d(1, 16, kernel_size=5 ,padding=2)
        self.conv2 = nn.Conv2d(16, 32, kernel_size=5,padding=2)
        self.conv3 = nn.Conv2d(32, 64, kernel_size=5,padding=2)
        self.mp = nn.MaxPool2d(kernel_size=2)
        self.reblock1 = ResidualBlock(16)
        self.reblock2 = ResidualBlock(32)
        self.reblock3 = ResidualBlock(64)
        self.fc = nn.Linear(64 * 4 * 4,10)
        
    def forward(self, x):
        in_size = x.size(0)
        x = self.mp(F.relu(self.conv1(x)))
        x = self.reblock1(x)
        x = self.mp(F.relu(self.conv2(x)))
        x = self.reblock2(x)
        x = self.mp(F.relu(self.conv3(x)))
        x = self.reblock3(x)
        x = x.view(in_size, -1)
        return self.fc(x)

model = Net()
device = torch.device('cuda')
model.to(device)

criterion = torch.nn.CrossEntropyLoss()


optimizer = torch.optim.SGD(model.parameters(), lr=0.01, momentum=0.5)

def train(epoch):
    running_loss = 0
    for batch_index, data in enumerate(train_loader, 0):
        inputs, target = data
        inputs, target = inputs.to(device), target.to(device)
        optimizer.zero_grad()
        
        outputs = model(inputs)
        loss = criterion(outputs, target)
        loss.backward()
        optimizer.step()
        
        running_loss += loss.item()
        
        if batch_index % 200 == 199:
            print('[%d, %d] loss: %.3f' % (epoch + 1, batch_index + 1, running_loss / 200))
            running_loss = 0.0
    loss_list.append(running_loss)

def test():
    correct = 0
    total = 0
    with torch.no_grad():
        for data in test_loader:
            images, labels = data
            images, labels = images.to(device), labels.to(device)
            outputs = model(images)
            _, predicts = torch.max(outputs.data, dim=1)
            total += labels.size(0)
            correct += (predicts == labels).sum().item()
            
    print('Accuracy on test sets: %d%%' % (100 * correct / total))
    print('Total / Correct: [', total, '/', correct, ']')
    accuracy_list.append(correct / total)

for epoch in range(5):
    train(epoch)
    epoch_list.append(epoch)
    test()
plt.plot(epoch_list, accuracy_list)
plt.grid()
plt.show()
plt.plot(epoch_list, loss_list)
plt.grid()
plt.show()

epoch_list

loss_list

报错为mat1 and mat2 shapes cannot be multiplied (64x576 and 1024x10)

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

10条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
专家-皆知 2024-05-13 00:10
关注
检查卷积层输出通道与残差分支是否匹配。

以上回复有部分引自免费微信小程序：皆我百晓生。如问题尚未解决，还请稍待，如有疑问请回复进一步沟通。

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(9条)

报告相同问题？

关注问题

深度学习残差应该怎么理解
2024-11-24 10:35

太极幻宇的博客在深度学习中，特别是在残差网络（Residual Networks，ResNet）中，残差具有特定的含义。它指的是在神经网络中引入的跳跃连接（Skip Connections）允许直接将前面层的输出加到后面层的输出上，这样的结构可以帮助...
人工智能深度学习100种网络模型，精心整理，全网最全，PyTorch框架逐一搭建
2023-06-03 08:39

微学AI的博客大家好，我是微学AI，今天给大家介绍一下人工智能深度学习100种网络模型，这些模型可以用PyTorch深度学习框架搭建。模型按照个人学习顺序进行排序。
基于深度学习的预训练好的超分辨率模型
2022-05-18 22:54

1. EDSR_x4.pb：单图像超分辨率纸的增强深度残差网络模型-将输入图像分辨率提高4倍 2. ESPCN_x4.pb：使用高效的亚像素卷积神经网络实现实时单图像和视频超分辨率的超分辨率模型，将分辨率提高4倍 3. FSRCNN_x3.pb：...
深度学习——残差神经网路
2025-09-05 23:30

fsnine的博客残差学习的核心思想可以通过微分方程来理解。假设最优的映射H(x)可以表示为： H(x) = x + F(x) 其中F(x)是我们需要学习的残差函数。这种表示与微分方程中的"扰动理论"有相似之处，将复杂问题分解为容易解决的部分（x...
残差：从统计学到深度学习的核心概念
2025-09-13 23:31

大千AI助手的博客残差（Residual）是统计学和机器学习中的重要概念，指观测值与模型预测值之间的差异。eiyi−yieiyi−yiyiy_iyi是实际观测值 yi\hat{y}_iyi是模型预测值举个简单例子：在房价预测模型中，如果某房屋...
深度学习----------------------残差网络ResNet
2024-08-22 23:44

Einstein·Jun的博客 ①残差块使得很深的网络更加容易训练甚至可以训练一千层的网络②残差网络对随后的深度神经网络设计产生了深远影响，无论是卷积类网络还是全连接类网络。
深度学习模型：残差网络（ResNet）详解
2025-01-31 11:19

古龙飞扬的博客 ResNet通过引入残差学习和跳跃连接，成功地解决了深层网络的退化问题，成为深度学习领域中的重要架构之一。其设计思想对后续研究产生了深远影响，推动了计算机视觉等领域的发展。希望这份详解能帮助更好地理解ResNet...
深度学习篇---常用的模型网络优化模块
2025-09-10 16:37

Atticus-Orion的博客模型网络优化模块主要分为注意力模块、轻量化模块和计算加速模块三大类。注意力模块（如SE、CBAM）通过增强重要特征提升识别精度；轻量化模块（如深度可分离卷积、瓶颈层）通过参数压缩实现移动端部署；计算加速模块...
【动手学深度学习】ResNet残差网络
2025-04-24 15:09

架构沉思录的博客何凯明等人提出了残差网络（ResNet），其主要目的是解决深度神经网络训练过程中遇到的问题，尤其是梯度消失和梯度爆炸问题，以及随着网络层数增加而出现的退化现象。 ResNet在2015年的ImageNet图像识别挑战赛夺魁，...
深度学习中的模块改进
2023-12-05 22:05

只想睡觉111的博客 深度学习中的一些经典模块
【计算机视觉】基于深度学习的图像分类神经网络模型应用介绍
2025-08-27 10:41

内容涵盖人工智能、机器学习、神经网络与深度学习的关系，重点解析了backbone、pretrain_model、batch_size、learning_rate等训练超参数的含义，以及准确率、召回率、IoU、mAP等模型评价指标。同时详细介绍了...
机器学习和深度学习模型汇总
2018-07-10 11:09

深度学习是人工智能领域中的一个重要分支，它主要涉及神经网络的设计和优化。其中，卷积神经网络（CNN）在图像处理、语音识别、自然语言处理等多个领域取得了显著成果。本篇文章将重点介绍CNN模型及其在机器学习中的...
深度学习模型架构----ResNet（残差网络）
2025-07-14 08:50

AI扶我青云志的博客典型结构包含BasicBlock（浅层网络）和BottleneckBlock（深层网络）两种残差模块，衍生出ResNet18/34/50/101/152等系列模型。该架构优势在于能训练极深网络且不退化，被广泛应用于图像分类、目标检测、语义分割等...
深度学习模块缝合教程：从理论到实践
2025-03-12 11:57

RockLiu@805的博客模块缝合是深度学习研究中的一个重要环节。无论是创造新模块还是复用现有模块，都需要理论与实践相结合。创新需要深厚的技术积累和对前沿领域的关注。缝合需要灵活的思维方式和扎实的实验基础。复用则需要对不同领域...
深度学习——残差网络（ResNet）
2023-10-15 22:00

星石传说的博客本章主要学习残差网络参考书：《动手学深度学习》总之，残差网络通过残差映射学习到了输入与输出之间的差异；通过将输入与输出直接相加，实现了信息的跳跃连接；通过堆叠多个残差块来构建更深的网络，提高了网络的...
深度学习深度残差学习程序
2016-01-17 10:34

深度学习是一种人工智能领域的核心技术，它模仿人脑神经网络的工作方式，通过大量的数据训练模型来解决复杂问题。在图像识别、语音识别、自然语言处理等领域，深度学习已经取得了显著的成就。"深度学习深度残差学习...
从零开始大模型开发与微调：ResNet残差模块的实现
2024-06-24 00:35

程序员光剑的博客在深度学习领域，尤其是神经网络模型的发展中，提高模型性能和优化训练过程是核心目标。ResNet（残差网络）正是为解决深层网络训练中梯度消失或梯度爆炸问题而诞生的一种创新架构。通过引入残差连接，ResNet使得网络...
人工智能领域的深度学习模型优化策略
2024-07-04 14:13

LindsayLucius的博客在人工智能的广阔天地中，深度学习作为其核心驱动力之一，已广泛应用于图像识别、自然语言处理、推荐系统等多个领域。然而，随着模型复杂度的增加和数据量的爆炸性增长，如何高效、准确地训练和优化深度学习模型成为...
【经典网络解析（七）】 ResNet | 残差模块，为什么残差模块有效，基本结构
2023-09-25 22:14

Qodicat的博客 ResNet残差模块全解析，为什么ResNet如此有效？
基于深度学习单目深度估计.zip
2025-09-19 09:49

该深度学习项目不仅与人工智能紧密相关，还可能与计算机视觉领域的yolo（You Only Look Once）目标检测模型结合，利用yolo的快速目标检测性能，来辅助进行更精确的深度估计。单目深度估计作为一项前沿技术，在自动...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 5月21日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 5月13日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 5月13日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 5月13日

深度学习残差模块模型

10条回答 默认 最新

问题事件

10条回答默认最新