pytorch提高正确率，反向传播不会写

问题遇到的现象和发生背景

在改进一个resnet18的模型的过程中，我们遇到了了一个正确率在80%波动的一个障碍，我们想使得正确率更高，于是想让误差反向传播的过程在一个循环里搞两遍，但是出现了这样的报错，请问如何让误差反向传播过程在一个循环里搞两遍呢？

问题相关代码，请勿粘贴截图

# -*- coding: utf-8 -*-
"""
Created on Fri Jul 22 10:26:33 2022
@author: Blucoris Liang
"""

import torch
import torch.nn as nn
import torch.utils.data as Data
import torchvision.transforms as transforms
import torchvision.datasets as datasets
import torchvision.models as models

EPOCH=30
BATCH_SIZE=40
LR=0.0007

normalize = transforms.Normalize(mean=[0.485, 0.456, 0.406],
                              std=[0.229, 0.224, 0.225])   

train_dataset = datasets.ImageFolder(
        'C:\\Users\\19544\\.spyder-py3\\leapGestRecog\\00',
        transforms.Compose([
                transforms.RandomResizedCrop(224),
                transforms.RandomHorizontalFlip(),
                transforms.ToTensor(),
                normalize,
                ]))

train_loader = Data.DataLoader(
        train_dataset,
        batch_size=BATCH_SIZE,
        shuffle=True)

test_loader = Data.DataLoader(
        datasets.ImageFolder(
                'C:\\Users\\19544\\.spyder-py3\\leapGestRecog\\03', 
                transforms.Compose([
                        transforms.Resize(256),
                        transforms.CenterCrop(224),
                        transforms.ToTensor(),
                        normalize,
                        ])),
        batch_size=BATCH_SIZE, shuffle=False,)

# 数据集长度
train_data_size = len(train_dataset)
print('训练集的长度为:{}'.format(train_data_size))



model = models.resnet18(pretrained=True)

################################
if torch.cuda.is_available():  #
    model = models.resnet18(pretrained=True).cuda()   #
################################



model.fc = torch.nn.Linear(in_features=512, out_features=10, bias=True).cuda()

fc_params = list(map(id, model.fc.parameters())) # map函数是将fc.parameters()的id返回并组成一个列表

base_params = filter(lambda p: id(p) not in fc_params, model.parameters()) # filter函数是将model.parameters()中地址不在fc.parameters的id中的滤出来

optimizer = torch.optim.SGD([ {'params': base_params}, {'params': model.fc.parameters(), 'lr': LR * 100}], lr=LR)

loss_func=nn.CrossEntropyLoss()

################################
if torch.cuda.is_available():  #
    loss_func = loss_func.cuda()   #
################################


class AverageMeter(object):
    """Computes and stores the average and current value"""
    def __init__(self, name, fmt=':f'):
        self.name = name
        self.fmt = fmt
        self.reset()

    def reset(self):
        self.val = 0
        self.avg = 0
        self.sum = 0
        self.count = 0

    def update(self, val, n=1):
        self.val = val
        self.sum += val * n
        self.count += n
        self.avg = self.sum / self.count

    def __str__(self):
        fmtstr = '{name} {val' + self.fmt + '} ({avg' + self.fmt + '})'
        return fmtstr.format(**self.__dict__)
            
def accuracy(output, target, topk=(1,)):
    with torch.no_grad():
        maxk = max(topk)
        batch_size = target.size(0)

        _, pred = output.topk(maxk, 1, True, True)
        pred = pred.t()
        correct = pred.eq(target.view(1, -1).expand_as(pred))

        res = []
        for k in topk:
            correct_k = correct[:k].view(-1).float().sum(0, keepdim=True)
            res.append(correct_k.mul_(100.0 / batch_size))
        return res           
            
train_losses = AverageMeter('TrainLoss', ':.4e')
train_top1 = AverageMeter('TrainAccuracy', ':6.2f')
test_losses = AverageMeter('TestLoss', ':.4e')
test_top1 = AverageMeter('TestAccuracy', ':6.2f')

for epoch in range(EPOCH):
    
    model.train()
    for i,(images,target) in enumerate(train_loader):
        ################################
        if torch.cuda.is_available():  #
            images = images.cuda()         #
            target = target.cuda()   #
        ################################
        output=model(images)
        ################################
        if torch.cuda.is_available():  #
            output = output.cuda()   #
        ################################
        loss= loss_func(output,target)
        
        acc1, = accuracy(output, target, topk=(1,))
        train_losses.update(loss.item(), images.size(0))
        train_top1.update(acc1[0], images.size(0))
        # 反向传播第一遍
        optimizer.zero_grad()
        loss.backward(retain_graph = True)
        optimizer.step()
        torch.autograd.set_detect_anomaly(True)
        # 反向传播第二遍
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()
        
        print('Epoch[{}/{}],TrainLoss:{}, TrainAccuracy:{}'.format(epoch,EPOCH,train_losses.val, train_top1.val))
           
    model.eval()
    with torch.no_grad():
        for i,(images,target) in enumerate(test_loader):
            ################################
            if torch.cuda.is_available():  #
                images = images.cuda()    #
                target = target.cuda()   #
            ################################
            output=model(images)
            loss= loss_func(output,target)
            
            acc1, = accuracy(output, target, topk=(1,))
            test_losses.update(loss.item(), images.size(0))
            test_top1.update(acc1[0], images.size(0))
            
    print('TestLoss:{}, TestAccuracy:{}'.format(test_losses.avg, test_top1.avg))

运行结果及报错内容

runfile('C:/Users/19544/.spyder-py3/成功对手势识别用resnet进行了第一次训练.py', wdir='C:/Users/19544/.spyder-py3')
训练集的长度为:2000
D:\ANACONDA\envs\MyEnv\lib\site-packages\torch\autograd\__init__.py:173: UserWarning: Error detected in AddmmBackward0. No forward pass information available. Enable detect anomaly during forward pass for more information. (Triggered internally at  C:\actions-runner\_work\pytorch\pytorch\builder\windows\pytorch\torch\csrc\autograd\python_anomaly_mode.cpp:85.)
  Variable._execution_engine.run_backward(  # Calls into the C++ engine to run the backward pass
Traceback (most recent call last):

  File "C:\Users\19544\.spyder-py3\成功对手势识别用resnet进行了第一次训练.py", line 146, in <module>
    loss.backward()

  File "D:\ANACONDA\envs\MyEnv\lib\site-packages\torch\_tensor.py", line 363, in backward
    torch.autograd.backward(self, gradient, retain_graph, create_graph, inputs=inputs)

  File "D:\ANACONDA\envs\MyEnv\lib\site-packages\torch\autograd\__init__.py", line 173, in backward
    Variable._execution_engine.run_backward(  # Calls into the C++ engine to run the backward pass

RuntimeError: one of the variables needed for gradient computation has been modified by an inplace operation: [torch.cuda.FloatTensor [512, 10]], which is output 0 of AsStridedBackward0, is at version 2; expected version 1 instead. Hint: the backtrace further above shows the operation that failed to compute its gradient. The variable in question was changed in there or anywhere later. Good luck!

我的解答思路和尝试过的方法

之前尝试过添加上了retain_graph = True，好像也不行

我想要达到的结果

成功实现在一个循环里误差反向传播两次，或者希望能获取大家的其他提高正确率的好方法

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
herosunly Python领域优质创作者 2022-08-03 10:37
关注
反向传播那部分的代码修改如下：

loss.backward(retain_graph=True) optimizer.step() optimizer.zero_grad() loss.backward() optimizer.step() optimizer.zero_grad()
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(2条)

报告相同问题？

关注问题

pytorch提高正确率，反向传播不会写 python pytorch 人工智能
2022-08-03 09:05

回答 3 已采纳 反向传播那部分的代码修改如下： loss.backward(retain_graph=True) optimizer.step() optimizer.zero_grad() loss.backwar
pytorch训练时怎么提高显卡的利用率？ pytorch 深度学习自然语言处理
2022-03-08 10:24

回答 2 已采纳 work number设置到cpu最大核心数，batch size 搞大点，你的显存才用了2G，还有那么多呢，不过显卡利用率低很正常，又不是挖矿，显卡很多时候要等硬盘或者内存读取信息呢。你把这里换成c
Pytorch框架nn.RNN训练时反向传播报错 c++ python pytorch
2023-03-22 16:17

回答 5 已采纳基于最新版ChatGPT4的回答，望采纳!!!有其他问题也可以询问我哦、”(最新版更智能，功能更加强大) 这个问题是由于在循环中，计算图被保留了，但在每次循环时，其实我们需要重新构建计算图。因此，需要
人工智能 作业3：例题复现使用Pytorch实现反向传播
2022-05-10 10:52

小狗小狗小狗的博客目录：例题复现：使用深度学习框架Pytorch显示反向传播对比：手动和使用Pytorch实现反向传播结果对比实现方法对比修改：激活函数使用Pytorch自带函数torch.sigmmod使用Relu修改：损失函数修改使用Pytoch自带函数t.nn...
用pytorch写了一个经典的鸢尾花分类 pytorch 分类机器学习
2022-10-25 10:18

回答 2 已采纳尝试把batch size调小，或者学习率调小点试试。
TextCNN 反向传播过程速度太慢 python pytorch 自然语言处理
2023-04-10 16:41

回答 2 已采纳以下内容部分参考ChatGPT模型：可能是由于反向传播中梯度下降算法的迭代次数过多导致速度变慢。可以尝试以下几种方法来优化：减少网络层数和神经元数量，降低模型的复杂度。使用更高效的优化器，如Ad
pytorch 的安装。想不改动cuda版本 python pytorch 人工智能
2022-10-27 18:56

回答 2 已采纳 Pytorch-gpu版安装教程【注意：无需提前安装cuda和cudnn】_山风wind的博客-CSDN博客_pytorch一定要cuda吗
pytorch之求导和反向传播，.backward()函数，权值更新
2021-10-26 21:32

向前向前向前！的博客在pytorch中有自动求导功能，张量tensor中有一个参数requires_grad，当我们创建一个tensor时设置其为True时即标记为自动求导，此时这个张量参与的运算会被跟踪记录，其默认值是false 需要注意的是，这个requires_...
pytorch官网给的resnet程序跑不通 pytorch 人工智能深度学习
2022-03-21 08:30

回答 1 已采纳提示不是说了吗，需要切换函数的API，你用的函数是旧版本的，需要切换到新版本去，报错提示里面也跟你说了要切换哪些什么函数了
为什么在pytorch中使用VGG16不用预训练，自己从头训练猫狗分类，正确率只有74%就上不去了？ pytorch 深度学习神经网络
2021-10-21 23:53

回答 1 已采纳官方pretrain的模型数据集是imagenet，样本数是你这个数据集的很多倍，这样的vgg网络卷积层的参数基本收敛到比较好的一个情况，你直接用来finetune只要稍微微调一下最后的fc层就可以得
在pycharm安装cv2，pytorch遇到问题 pycharm pytorch 人工智能有问必答
2023-03-05 11:03

回答 5 已采纳将pip3 install opencv 换成 pip3 install opencv-python 试下看是否可正常安装
Pytorch 反向传播 计算图被修改的报错
2024-01-07 19:55

Midsummer-逐梦的博客上进行了原地操作（上述的修改形状操作），就可能破坏计算图，使其不可导或其他，总之是导致反向传播时无法正确计算梯度，从而引发报错。在这个例子中，label由第一条语句前向传播得到，是直接与网络的输出连在一起...
pycharm无法检测到pytorch pycharm python pytorch
2023-01-07 21:39

回答 2 已采纳你这个是在终端里面打开的吧，没有激活环境就会这样。正常右键运行或者Ctrl+shift+F10运行是可以运行的，你这个是在终端，前面才会有ps的字样，表示power shell。你可以输入cmd转到c
PyTorch实战：反向传播构建深度模型
2024-04-27 16:38

禅与计算机程序设计艺术的博客深度学习的蓬勃发展，离不开其核心算法之一——反向传播算法。反向传播算法使得神经网络能够根据误差信号调整内部参数，从而不断优化模型性能。PyTorch作为一款流行的深度学习框架，提供了丰富的工具和API，使得构建...
Pytorch实战__反向攻击（Adversarial Attack）
2021-11-18 21:30

hello_JeremyWang的博客 0. 介绍 ...反向攻击就是在原图片中加一些极其微小的杂讯（这些杂讯有时候人眼根本看不出来），以使得我们之前训练出来的很不错的神经网络失效。听起来是不是很酷，以后提前偷摸下班的时候就可以不被摄像
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 8月11日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 8月3日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 8月3日

悬赏问题

¥20 机器学习能否像多层线性模型一样处理嵌套数据
¥20 西门子S7-Graph,S7-300，梯形图
¥50 用易语言http 访问不了网页
¥50 safari浏览器fetch提交数据后数据丢失问题
¥15 matlab不知道怎么改，求解答！！
¥15 永磁直线电机的电流环pi调不出来
¥15 用stata实现聚类的代码
¥15 请问paddlehub能支持移动端开发吗？在Android studio上该如何部署？
¥20 docker里部署springboot项目，访问不到扬声器
¥15 netty整合springboot之后自动重连失效