pytorch的resnet猫狗大战跑不完不收敛

问题遇到的现象和发生背景

我用这个代码跑了一下猫狗大战数据集，为什么跑到一半就跑不下去了，只能跑到第二代，而且感觉跑得非常慢。

问题相关代码，请勿粘贴截图

# -*- coding: utf-8 -*-
"""
Created on Fri Jul 22 10:26:33 2022

# 11:34第一代
# 11.48第二代
# 12:14 跑到一半不跑了
@author: 19544
"""

import torch
import torch.nn as nn
import torch.utils.data as Data
import torchvision.transforms as transforms
import torchvision.datasets as datasets
import torchvision.models as models

EPOCH=5
BATCH_SIZE=40
LR=0.01

normalize = transforms.Normalize(mean=[0.485, 0.456, 0.406],
                              std=[0.229, 0.224, 0.225])   

train_dataset = datasets.ImageFolder(
        'D:\\项目实验文件夹\\猫狗大战数据集\\dogcat_2',
        transforms.Compose([
                transforms.RandomResizedCrop(224),
                transforms.RandomHorizontalFlip(),
                transforms.ToTensor(),
                normalize,
                ]))

train_loader = Data.DataLoader(
        train_dataset,
        batch_size=BATCH_SIZE,
        shuffle=True)

test_loader = Data.DataLoader(
        datasets.ImageFolder(
                'D:\\项目实验文件夹\\猫狗大战数据集\\dogcat_2', 
                transforms.Compose([
                        transforms.Resize(256),
                        transforms.CenterCrop(224),
                        transforms.ToTensor(),
                        normalize,
                        ])),
        batch_size=BATCH_SIZE, shuffle=False,)

model = models.resnet18(pretrained=True)
model.fc = torch.nn.Linear(in_features=512, out_features=5, bias=True)

fc_params = list(map(id, model.fc.parameters())) # map函数是将fc.parameters()的id返回并组成一个列表
base_params = filter(lambda p: id(p) not in fc_params, model.parameters()) # filter函数是将model.parameters()中地址不在fc.parameters的id中的滤出来
optimizer = torch.optim.SGD([ {'params': base_params}, {'params': model.fc.parameters(), 'lr': LR * 100}], lr=LR,)
loss_func=nn.CrossEntropyLoss()

class AverageMeter(object):
    """Computes and stores the average and current value"""
    def __init__(self, name, fmt=':f'):
        self.name = name
        self.fmt = fmt
        self.reset()

    def reset(self):
        self.val = 0
        self.avg = 0
        self.sum = 0
        self.count = 0

    def update(self, val, n=1):
        self.val = val
        self.sum += val * n
        self.count += n
        self.avg = self.sum / self.count

    def __str__(self):
        fmtstr = '{name} {val' + self.fmt + '} ({avg' + self.fmt + '})'
        return fmtstr.format(**self.__dict__)
            
def accuracy(output, target, topk=(1,)):
    with torch.no_grad():
        maxk = max(topk)
        batch_size = target.size(0)

        _, pred = output.topk(maxk, 1, True, True)
        pred = pred.t()
        correct = pred.eq(target.view(1, -1).expand_as(pred))

        res = []
        for k in topk:
            correct_k = correct[:k].view(-1).float().sum(0, keepdim=True)
            res.append(correct_k.mul_(100.0 / batch_size))
        return res           
            
train_losses = AverageMeter('TrainLoss', ':.4e')
train_top1 = AverageMeter('TrainAccuracy', ':6.2f')
test_losses = AverageMeter('TestLoss', ':.4e')
test_top1 = AverageMeter('TestAccuracy', ':6.2f')

for epoch in range(EPOCH):
    
    model.train()
    for i,(images,target) in enumerate(train_loader):
        output=model(images)
        loss= loss_func(output,target)
        
        acc1, = accuracy(output, target, topk=(1,))
        train_losses.update(loss.item(), images.size(0))
        train_top1.update(acc1[0], images.size(0))

        optimizer.zero_grad()
        loss.backward()
        optimizer.step()
        
        print('Epoch[{}/{}],TrainLoss:{}, TrainAccuracy:{}'.format(epoch,EPOCH,train_losses.val, train_top1.val))
           
    model.eval()
    with torch.no_grad():
        for i,(images,target) in enumerate(test_loader):
            output=model(images)
            loss= loss_func(output,target)
            
            acc1, = accuracy(output, target, topk=(1,))
            test_losses.update(loss.item(), images.size(0))
            test_top1.update(acc1[0], images.size(0))
            
    print('TestLoss:{}, TestAccuracy:{}'.format(test_losses.avg, test_top1.avg))

运行结果及报错内容

Epoch[2/5],TrainLoss:0.7035315036773682, TrainAccuracy:47.5
Epoch[2/5],TrainLoss:0.7905141711235046, TrainAccuracy:47.5
Epoch[2/5],TrainLoss:0.7110738158226013, TrainAccuracy:47.5
Epoch[2/5],TrainLoss:0.709513783454895, TrainAccuracy:47.5
Epoch[2/5],TrainLoss:0.6796354055404663, TrainAccuracy:60.0
Epoch[2/5],TrainLoss:0.6862636804580688, TrainAccuracy:55.0

我的解答思路和尝试过的方法

我尝试过改了下代数，可是还是算得太长，而且正确率不收敛。

我想要达到的结果

希望帮忙让它跑完并收敛。

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
迪菲赫尔曼人工智能领域优质创作者 2022-07-22 13:14
关注
跑得慢是因为没有使用cuda加速

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(2条)

报告相同问题？

关注问题

pytorch的resnet猫狗大战跑不完不收敛 python pytorch 机器学习
2022-07-22 12:31

回答 3 已采纳跑得慢是因为没有使用cuda加速
pytorch官网给的resnet程序跑不通 pytorch 人工智能深度学习
2022-03-21 08:30

回答 1 已采纳提示不是说了吗，需要切换函数的API，你用的函数是旧版本的，需要切换到新版本去，报错提示里面也跟你说了要切换哪些什么函数了
pytorch 的安装。想不改动cuda版本 python pytorch 人工智能
2022-10-27 18:56

回答 2 已采纳 Pytorch-gpu版安装教程【注意：无需提前安装cuda和cudnn】_山风wind的博客-CSDN博客_pytorch一定要cuda吗
Pytorch学习之猫狗大战
2022-04-13 15:31

Jolen_xie的博客 34: model_fit = models.resnet34(pretrained=pretrained) elif feature == 50: model_fit = models.resnet50(pretrained=pretrained) elif feature == 101: model_fit = models.resnet101(pretrained=pretrained) ...
为啥始终不能用gpu跑pytorch框架 pytorch 机器学习深度学习
2022-10-28 11:16

回答 1 已采纳显存占用多少？不要看显卡使用率，这个是平均使用率，如果模型小数据少，使用率低很正常
pytorch在pycharm中调用不出来 pycharm python pytorch
2023-03-02 16:17

回答 2 已采纳应该是你pycharm里面配置的python解释器与系统path环境下的不是同一个python解释器，去pycahrm设置里面改一下
如何直接调用Pytorch自带的Resnet结构 cnn pytorch 深度学习
2022-10-11 21:29

回答 1 已采纳 B站上有个人讲的不错，你可以去搜一下小土堆
猫狗大战——pytorch+resnet18
2021-01-26 18:04

G-Jarvey的博客 cats vs dogs——resnet18数据Nettrain+test 数据这是一个在kaggle上的竞赛，原数据提供了25000张图片，本文所使用的数据集来自其中train的8000张,包括4000张猫和4000张狗 #将数据导入 data_dir = 'E:\\code\\...
pytorch不调用gpu运算 pytorch 深度学习
2022-11-11 16:14

回答 2 已采纳给你找了一篇非常好的博客，你可以看看是否有帮助，链接：pytorch无法调用gpu的一些解决方法
卸载pytorch能不能直接删除相关文件 python pytorch
2022-10-27 15:11

回答 2 已采纳如果你用的conda的虚拟环境，直接conda路径下面有个Anaconda3\envs文件，里面找到虚拟环境名直接删除整个文件夹就行。如果你安装在base环境，就没得法子了，除非你重装conda
Linux下Pytorch安装后找不到包 linux python pytorch
2021-11-09 23:35

回答 3 已采纳如果是在终端使用，需要进入该虚拟环境如果是在IDE使用，切换解释器为conda和对应的pytorch虚拟环境即可
【PyTorch】图像分类"猫狗大战"实战
2019-10-13 19:17

lynnhgwang的博客 ├── pytorch_dogsVScats │ ├── datas │ │ ├── Dataset │ │ ├── train │ │ │ ├── dog │ │ │ └── cat │ │ └── valid │ │ ├── dog │ │ └── cat │ ├── data │ │ ...
pytorch GPU 找不到文件 python pytorch
2023-03-30 10:15

回答 2 已采纳已解决
【图像分类】实战——使用ResNet实现猫狗分类（pytorch）
2021-05-28 21:34

AI浩的博客 ResNet（Residual Neural Network）由微软研究院的Kaiming He等四名华人提出，通过使用ResNet Unit成功训练出了152层的神经网络，并在ILSVRC2015比赛中取得冠军，在top5上的错误率为3.57%，同时参数量比VGGNet低，...
PyTorch深度学习图像分类--猫狗大战
2022-12-09 15:00

Matrix_CS的博客使用Pytorch进行了深度学习中一个案例的练习：猫狗大战，完整的体验了深度学习流程。
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 7月31日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 7月23日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 7月22日

悬赏问题

¥20 西门子S7-Graph,S7-300，梯形图
¥50 用易语言http 访问不了网页
¥50 safari浏览器fetch提交数据后数据丢失问题
¥15 matlab不知道怎么改，求解答！！
¥15 永磁直线电机的电流环pi调不出来
¥15 用stata实现聚类的代码
¥15 请问paddlehub能支持移动端开发吗？在Android studio上该如何部署？
¥20 docker里部署springboot项目，访问不到扬声器
¥15 netty整合springboot之后自动重连失效
¥15 悬赏！微信开发者工具报错，求帮改