pytorch提高正确率，反向传播不会写

问题遇到的现象和发生背景

在改进一个resnet18的模型的过程中，我们遇到了了一个正确率在80%波动的一个障碍，我们想使得正确率更高，于是想让误差反向传播的过程在一个循环里搞两遍，但是出现了这样的报错，请问如何让误差反向传播过程在一个循环里搞两遍呢？

问题相关代码，请勿粘贴截图

# -*- coding: utf-8 -*-
"""
Created on Fri Jul 22 10:26:33 2022
@author: Blucoris Liang
"""

import torch
import torch.nn as nn
import torch.utils.data as Data
import torchvision.transforms as transforms
import torchvision.datasets as datasets
import torchvision.models as models

EPOCH=30
BATCH_SIZE=40
LR=0.0007

normalize = transforms.Normalize(mean=[0.485, 0.456, 0.406],
                              std=[0.229, 0.224, 0.225])   

train_dataset = datasets.ImageFolder(
        'C:\\Users\\19544\\.spyder-py3\\leapGestRecog\\00',
        transforms.Compose([
                transforms.RandomResizedCrop(224),
                transforms.RandomHorizontalFlip(),
                transforms.ToTensor(),
                normalize,
                ]))

train_loader = Data.DataLoader(
        train_dataset,
        batch_size=BATCH_SIZE,
        shuffle=True)

test_loader = Data.DataLoader(
        datasets.ImageFolder(
                'C:\\Users\\19544\\.spyder-py3\\leapGestRecog\\03', 
                transforms.Compose([
                        transforms.Resize(256),
                        transforms.CenterCrop(224),
                        transforms.ToTensor(),
                        normalize,
                        ])),
        batch_size=BATCH_SIZE, shuffle=False,)

# 数据集长度
train_data_size = len(train_dataset)
print('训练集的长度为:{}'.format(train_data_size))



model = models.resnet18(pretrained=True)

################################
if torch.cuda.is_available():  #
    model = models.resnet18(pretrained=True).cuda()   #
################################



model.fc = torch.nn.Linear(in_features=512, out_features=10, bias=True).cuda()

fc_params = list(map(id, model.fc.parameters())) # map函数是将fc.parameters()的id返回并组成一个列表

base_params = filter(lambda p: id(p) not in fc_params, model.parameters()) # filter函数是将model.parameters()中地址不在fc.parameters的id中的滤出来

optimizer = torch.optim.SGD([ {'params': base_params}, {'params': model.fc.parameters(), 'lr': LR * 100}], lr=LR)

loss_func=nn.CrossEntropyLoss()

################################
if torch.cuda.is_available():  #
    loss_func = loss_func.cuda()   #
################################


class AverageMeter(object):
    """Computes and stores the average and current value"""
    def __init__(self, name, fmt=':f'):
        self.name = name
        self.fmt = fmt
        self.reset()

    def reset(self):
        self.val = 0
        self.avg = 0
        self.sum = 0
        self.count = 0

    def update(self, val, n=1):
        self.val = val
        self.sum += val * n
        self.count += n
        self.avg = self.sum / self.count

    def __str__(self):
        fmtstr = '{name} {val' + self.fmt + '} ({avg' + self.fmt + '})'
        return fmtstr.format(**self.__dict__)
            
def accuracy(output, target, topk=(1,)):
    with torch.no_grad():
        maxk = max(topk)
        batch_size = target.size(0)

        _, pred = output.topk(maxk, 1, True, True)
        pred = pred.t()
        correct = pred.eq(target.view(1, -1).expand_as(pred))

        res = []
        for k in topk:
            correct_k = correct[:k].view(-1).float().sum(0, keepdim=True)
            res.append(correct_k.mul_(100.0 / batch_size))
        return res           
            
train_losses = AverageMeter('TrainLoss', ':.4e')
train_top1 = AverageMeter('TrainAccuracy', ':6.2f')
test_losses = AverageMeter('TestLoss', ':.4e')
test_top1 = AverageMeter('TestAccuracy', ':6.2f')

for epoch in range(EPOCH):
    
    model.train()
    for i,(images,target) in enumerate(train_loader):
        ################################
        if torch.cuda.is_available():  #
            images = images.cuda()         #
            target = target.cuda()   #
        ################################
        output=model(images)
        ################################
        if torch.cuda.is_available():  #
            output = output.cuda()   #
        ################################
        loss= loss_func(output,target)
        
        acc1, = accuracy(output, target, topk=(1,))
        train_losses.update(loss.item(), images.size(0))
        train_top1.update(acc1[0], images.size(0))
        # 反向传播第一遍
        optimizer.zero_grad()
        loss.backward(retain_graph = True)
        optimizer.step()
        torch.autograd.set_detect_anomaly(True)
        # 反向传播第二遍
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()
        
        print('Epoch[{}/{}],TrainLoss:{}, TrainAccuracy:{}'.format(epoch,EPOCH,train_losses.val, train_top1.val))
           
    model.eval()
    with torch.no_grad():
        for i,(images,target) in enumerate(test_loader):
            ################################
            if torch.cuda.is_available():  #
                images = images.cuda()    #
                target = target.cuda()   #
            ################################
            output=model(images)
            loss= loss_func(output,target)
            
            acc1, = accuracy(output, target, topk=(1,))
            test_losses.update(loss.item(), images.size(0))
            test_top1.update(acc1[0], images.size(0))
            
    print('TestLoss:{}, TestAccuracy:{}'.format(test_losses.avg, test_top1.avg))

运行结果及报错内容

runfile('C:/Users/19544/.spyder-py3/成功对手势识别用resnet进行了第一次训练.py', wdir='C:/Users/19544/.spyder-py3')
训练集的长度为:2000
D:\ANACONDA\envs\MyEnv\lib\site-packages\torch\autograd\__init__.py:173: UserWarning: Error detected in AddmmBackward0. No forward pass information available. Enable detect anomaly during forward pass for more information. (Triggered internally at  C:\actions-runner\_work\pytorch\pytorch\builder\windows\pytorch\torch\csrc\autograd\python_anomaly_mode.cpp:85.)
  Variable._execution_engine.run_backward(  # Calls into the C++ engine to run the backward pass
Traceback (most recent call last):

  File "C:\Users\19544\.spyder-py3\成功对手势识别用resnet进行了第一次训练.py", line 146, in <module>
    loss.backward()

  File "D:\ANACONDA\envs\MyEnv\lib\site-packages\torch\_tensor.py", line 363, in backward
    torch.autograd.backward(self, gradient, retain_graph, create_graph, inputs=inputs)

  File "D:\ANACONDA\envs\MyEnv\lib\site-packages\torch\autograd\__init__.py", line 173, in backward
    Variable._execution_engine.run_backward(  # Calls into the C++ engine to run the backward pass

RuntimeError: one of the variables needed for gradient computation has been modified by an inplace operation: [torch.cuda.FloatTensor [512, 10]], which is output 0 of AsStridedBackward0, is at version 2; expected version 1 instead. Hint: the backtrace further above shows the operation that failed to compute its gradient. The variable in question was changed in there or anywhere later. Good luck!

我的解答思路和尝试过的方法

之前尝试过添加上了retain_graph = True，好像也不行

我想要达到的结果

成功实现在一个循环里误差反向传播两次，或者希望能获取大家的其他提高正确率的好方法

展开全部

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
herosunly Python领域优质创作者 2022-08-03 02:37
关注
反向传播那部分的代码修改如下：

loss.backward(retain_graph=True) optimizer.step() optimizer.zero_grad() loss.backward() optimizer.step() optimizer.zero_grad()
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报
编辑

预览
轻敲空格完成输入
显示为

卡片

标题

链接
评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(2条)

编辑

预览

报告相同问题？

关注问题

Pytorch框架nn.RNN训练时反向传播报错 c++ python pytorch
2023-03-22 08:17

回答 5 已采纳基于最新版ChatGPT4的回答，望采纳!!!有其他问题也可以询问我哦、”(最新版更智能，功能更加强大) 这个问题是由于在循环中，计算图被保留了，但在每次循环时，其实我们需要重新构建计算图。因此，需要
pytorch训练时怎么提高显卡的利用率？ pytorch 深度学习自然语言处理
2022-03-08 02:24

回答 2 已采纳 work number设置到cpu最大核心数，batch size 搞大点，你的显存才用了2G，还有那么多呢，不过显卡利用率低很正常，又不是挖矿，显卡很多时候要等硬盘或者内存读取信息呢。你把这里换成c
用pytorch写了一个经典的鸢尾花分类 pytorch 分类机器学习
2022-10-25 02:18

回答 2 已采纳尝试把batch size调小，或者学习率调小点试试。
人工智能 作业3：例题复现使用Pytorch实现反向传播
2022-05-10 02:52

小狗小狗小狗的博客目录：例题复现：使用深度学习框架Pytorch显示反向传播对比：手动和使用Pytorch实现反向传播结果对比实现方法对比修改：激活函数使用Pytorch自带函数torch.sigmmod使用Relu修改：损失函数修改使用Pytoch自带函数t.nn...
TextCNN 反向传播过程速度太慢 python pytorch 自然语言处理
2023-04-10 08:41

回答 2 已采纳以下内容部分参考ChatGPT模型：可能是由于反向传播中梯度下降算法的迭代次数过多导致速度变慢。可以尝试以下几种方法来优化：减少网络层数和神经元数量，降低模型的复杂度。使用更高效的优化器，如Ad
pytorch 的安装。想不改动cuda版本 python pytorch 人工智能
2022-10-27 10:56

回答 2 已采纳 Pytorch-gpu版安装教程【注意：无需提前安装cuda和cudnn】_山风wind的博客-CSDN博客_pytorch一定要cuda吗
为什么在pytorch中使用VGG16不用预训练，自己从头训练猫狗分类，正确率只有74%就上不去了？ pytorch 深度学习神经网络
2021-10-21 15:53

回答 1 已采纳官方pretrain的模型数据集是imagenet，样本数是你这个数据集的很多倍，这样的vgg网络卷积层的参数基本收敛到比较好的一个情况，你直接用来finetune只要稍微微调一下最后的fc层就可以得
pytorch之求导和反向传播，.backward()函数，权值更新
2021-10-26 13:32

向前向前向前！的博客在pytorch中有自动求导功能，张量tensor中有一个参数requires_grad，当我们创建一个tensor时设置其为True时即标记为自动求导，此时这个张量参与的运算会被跟踪记录，其默认值是false 需要注意的是，这个requires_...
pytorch官网给的resnet程序跑不通 pytorch 人工智能深度学习
2022-03-21 00:30

回答 1 已采纳提示不是说了吗，需要切换函数的API，你用的函数是旧版本的，需要切换到新版本去，报错提示里面也跟你说了要切换哪些什么函数了
c++如何封装Python写的pytorch模型生成exe文件 c++ python 机器学习
2022-01-27 11:52

回答 1 已采纳将你的模型转成ONNX然后openvino就能读取了。如果遇到一些网络层不能转到onnx，那就比较麻烦，需要替换成你自己实现的网络层才能导出onnx
在pycharm安装cv2，pytorch遇到问题 pycharm pytorch 人工智能有问必答
2023-03-05 03:03

回答 5 已采纳将pip3 install opencv 换成 pip3 install opencv-python 试下看是否可正常安装
Pytorch 反向传播 计算图被修改的报错
2024-01-07 11:55

Midsummer-逐梦的博客上进行了原地操作（上述的修改形状操作），就可能破坏计算图，使其不可导或其他，总之是导致反向传播时无法正确计算梯度，从而引发报错。在这个例子中，label由第一条语句前向传播得到，是直接与网络的输出连在一起...
Pytorch反向求导更新网络参数的方法
2020-09-18 11:37

PyTorch是一种开源的机器学习库，由Facebook的人工智能研究团队开发，主要用于计算机视觉和自然语言处理等领域的研究和开发。PyTorch的核心设计思想是提供一个灵活的框架，方便研究者和开发者快速实现和测试新的想法...
AI人工智能深度学习算法：反向传播与优化方法
2024-06-03 16:41

AI天才研究院的博客以下是标题为《AI人工智能深度学习算法：反向传播与优化方法》的技术博客文章正文内容： AI人工智能深度学习算法：反向传播与优化方法 1.背景介绍 1.1 深度学习的兴起近年来，人工智能领域取得了长足的进步,尤其是...
PyTorch实战：反向传播构建深度模型
2024-04-27 08:38

AI天才研究院的博客深度学习的蓬勃发展，离不开其核心算法之一——反向传播算法。反向传播算法使得神经网络能够根据误差信号调整内部参数，从而不断优化模型性能。PyTorch作为一款流行的深度学习框架，提供了丰富的工具和API，使得构建...
没有解决我的问题, 去提问