为什么在pytorch中使用VGG16不用预训练，自己从头训练猫狗分类，正确率只有74%就上不去了？

这是我的代码。请大家过目。
而且我在用训练好的pth模型进行单独测试时总会是第0类正确率很高（也就是猫的识别率很高狗的识别率很低）
测试集猫狗各500张，猫能识别出400多张而狗只能识别出十几张。
不知道问题出在哪里？
训练的loss会一直降，但是验真loss从0.7降到0.6，就趋于平滑，不再下降。
我试了调整学习率，但是没用。


import math
from torch import nn
from torchvision import models,datasets,transforms
import torch
import os
from torch.autograd import Variable
import csv
#import visdom


#viz = visdom.Visdom()
data_dir = 'VGGTrain'
data_transform = {
    'train':transforms.Compose([transforms.Resize((224, 224)),
                          transforms.ToTensor(),
                          transforms.Normalize([0.485,0.456,0.406], [0.229,0.224,0.225]),
                          transforms.RandomHorizontalFlip(p=0.5),#水平翻转
                          transforms.RandomRotation(15),  # 随机旋转
                          transforms.RandomCrop(224),  #随机剪裁
                          transforms.Pad(padding=4, padding_mode='edge'),#边缘填充
                          ]),
        'valid':transforms.Compose([transforms.Resize((224, 224)),
                          transforms.ToTensor(),
                          transforms.Normalize([0.485,0.456,0.406], [0.229,0.224,0.225])
                          ])
}

image_datasets = {x:datasets.ImageFolder(root=os.path.join(data_dir, x), transform=data_transform[x])
                    for x in ['train','valid']
                    }

dataloader = {x:torch.utils.data.DataLoader(dataset=image_datasets[x], batch_size=32, shuffle=True, num_workers=4)
              for x in ['train','valid']
}

x_example, y_example = next(iter(dataloader['train']))

example_classes = image_datasets['train'].classes

index_classes = image_datasets['train'].class_to_idx


model = models.vgg16(pretrained=False)


# 遍历模型中的所有模块
for m in model.modules():
    # 如果当前模块是卷积层或者线性层
    if isinstance(m, nn.Conv2d):
        #则进行xavier初始化
        nn.init.kaiming_normal_(m.weight, mode='fan_out', nonlinearity='relu')
        if m.bias is not None:
            nn.init.constant_(m.bias, 0)
    elif isinstance(m, nn.BatchNorm2d):
        nn.init.constant_(m.weight, 1)
        nn.init.constant_(m.bias, 0)
    elif isinstance(m, nn.Linear):
        nn.init.normal_(m.weight, 0, 0.01)
        nn.init.constant_(m.bias, 0)


model.classifier = torch.nn.Sequential(
    torch.nn.Linear(25088,512),
    torch.nn.ReLU(),
    torch.nn.Dropout(p=0.6),
    torch.nn.Linear(512,256),
    torch.nn.ReLU(),
    torch.nn.Dropout(p=0.6),
    torch.nn.Linear(256,2)
)


use_gpu = torch.cuda.is_available()
if use_gpu :
    model = model.cuda()


loss_f = torch.nn.CrossEntropyLoss()
optimizer = torch.optim.Adam(model.classifier.parameters(), lr=1e-4,weight_decay=0.01)

epochs = 99999


#viz.line([0], [-1], win='loss', opts=dict(title='loss'))
#viz.line([0], [-1], win='val_acc', opts=dict(title='val_acc'))
global_step = 0
best_acc = 0
best_epoch = 0

with open("loss2.txt", "w") as f:
    for epoch in range(epochs):

        print('----' * 10)
        print('Epoch {}/{}'.format(epoch + 1, epochs))

        for phase in ['train', 'valid']:
            if phase == 'train':
                print('Training...')
                model.train(True)

            else:
                print('Validing...')
                model.train(False)

            running_loss = 0.0
            running_corrects = 0

            for batch, data in enumerate(dataloader[phase]):

                x, y = data
                x, y = Variable(x.cuda()), Variable(y.cuda())

                y_pred = model(x)

                _, pred = torch.max(y_pred.data, 1)
                optimizer.zero_grad()


                loss = loss_f(y_pred, y)

                running_loss += loss.data
                if phase == 'train':
                    global_step += 1
                    loss.backward()
                    optimizer.step()

                running_corrects += torch.sum(pred == y.data)
                    

            epoch_loss = running_loss * 32 / len(image_datasets[phase])
            epoch_acc = 100 * running_corrects / len(image_datasets[phase])

            print('{} Loss:{} ACC:{}'.format(phase, epoch_loss, epoch_acc))
            if(phase == 'train'):
                f.writelines([str(epoch), ',', str(epoch_loss.item()),',',str(epoch_acc.item()), ','])
                
            if(phase == 'valid'):
                f.writelines([str(epoch_acc.item()),',',str(epoch_loss.item()), ';'])
                f.flush()
                if epoch_acc.item() > best_acc:
                    torch.save(model, 'best3.pth')
                    best_acc = epoch_acc.item()
                    best_epoch = epoch
                    print('最好的正确率是epoch：', best_epoch+1, '    正确率为：', best_acc)


print('最好的模型在epoch：', best_epoch)
torch.save(model, 'vggmodel2.pth')

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
只会git clone的程序员 2021-10-22 00:47
关注
官方pretrain的模型数据集是imagenet，样本数是你这个数据集的很多倍，这样的vgg网络卷积层的参数基本收敛到比较好的一个情况，你直接用来finetune只要稍微微调一下最后的fc层就可以得到一个比较好的分类结果了。相比于你自己从0训练网络，你的网络见过的数据比较少，容易过拟合在见到过的数据上，因此你自己从0训练的效果远远不如加载pretrain然后finetune的效果。

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

为什么在pytorch中使用VGG16不用预训练，自己从头训练猫狗分类，正确率只有74%就上不去了？ pytorch 深度学习神经网络
2021-10-21 23:53

回答 1 已采纳官方pretrain的模型数据集是imagenet，样本数是你这个数据集的很多倍，这样的vgg网络卷积层的参数基本收敛到比较好的一个情况，你直接用来finetune只要稍微微调一下最后的fc层就可以得
【深度学习】使用自己写的VGG16网络训练精度不提升 pytorch 深度学习神经网络
2022-05-30 00:00

回答 2 已采纳删除最后的softmax层，在内个relu之前加归一化就好了
torchvision中预训练的VGG16和一般论文里的VGG-VD-16有什么区别 pytorch 图像处理深度学习
2023-04-06 16:16

回答 1 已采纳 VGG16 和 VGG-VD-16 在网络结构上是有区别的。VGG16 是 VGG 网络的一种实现，而 VGG-VD-16 则是 VGG 网络的一种变体。 PyTorch 中的 torchvision
使用VGG迁移学习开启《猫狗大战挑战赛》
2020-11-20 20:48

雷恩Layne的博客文章目录一、前言二、加载数据集三、数据预处理四、构建VGG模型五、训练VGG模型六、...这里使用在 ImageNet 上预训练的 VGG 网络模型进行测试，因为原网络的分类结果是1000类，所以要进行迁移学习，对原网络进行 fin
pytorch训练时怎么提高显卡的利用率？ pytorch 深度学习自然语言处理
2022-03-08 10:24

回答 2 已采纳 work number设置到cpu最大核心数，batch size 搞大点，你的显存才用了2G，还有那么多呢，不过显卡利用率低很正常，又不是挖矿，显卡很多时候要等硬盘或者内存读取信息呢。你把这里换成c
pytorch 模型在GPU上但训练时仍使用CPU python 有问必答神经网络
2021-05-13 18:05

回答 3 已采纳你要安装cuda和cudnn，参考一下https://zhuanlan.zhihu.com/p/106133822
pytorch目标分类训练自己的数据集 python 有问必答
2021-07-27 17:08

回答 3 已采纳你好，我是有问必答小助手，非常抱歉，本次您提出的有问必答问题，超出我们目前的服务范围，暂时无法为您解答。问答VIP目前服务范围为：Python、Java、MySQL、Redis、MongoDB、H
Pytorch入门
2023-02-28 01:00

李一帆'的博客本篇博客参考Pytorch官方教程中文版和《Drive Into Deep Learning》Pytorch版对Pytorch和深度学习的基础知识进行总结，以便加深理解和记忆
多标签文本分类模型训练后在验证集上F1值为0 pytorch 分类自然语言处理
2023-04-16 13:55

回答 2 已采纳你好，根据你提供的信息，可能有以下几个原因：数据集问题：可能训练集和验证集的数据分布不一致，导致模型在验证集上表现不佳。建议检查一下数据集是否存在标签分布不均衡的情况。模型问题：可能预训练模型Ro
在pytorch中，使用cnn+lstm用于分类 python 有问必答深度学习神经网络
2021-05-29 00:45

回答 2 已采纳可以参考这篇文章，希望对你有帮助：pytorch实现用CNN和LSTM对文本进行分类_Alphapeople的博客-CSDN博客
pytorch在pycharm中调用不出来 pycharm python pytorch
2023-03-02 16:17

回答 2 已采纳应该是你pycharm里面配置的python解释器与系统path环境下的不是同一个python解释器，去pycahrm设置里面改一下
机器学习笔记 - 基于Torch Hub的VGG和ResNet
2022-05-08 06:00

坐望云起的博客当你在机器学习领域时，理论和实践是同等需要的。但是因为硬件限制会严重影响你的机器学习进程...例如，假设您有一个在 ImageNet 上训练的模型（1400 万张图像和20000个分类）。在这种情况下，针对相似且更具体的图像分
pytorch中这个数值为什么不变呢？ pytorch
2022-09-17 23:58

回答 1 已采纳我猜测tensor.data返回的应该是数据的副本而不是视图，所以x不会改变。tensor之间的计算直接使用tensor本身就好了，不需要使用data属性。你可以把tensor看作是多维数组，可以直接
读书:《深度学习框架PyTorch入门与实践》初注
2023-11-01 17:28

周陽讀書的博客记录读《深度学习框架PyTorch入门与实践》所思所想所惑所得。
《深度学习之pytorch实战计算机视觉》第9章多模型融合（代码可跑通）
2022-05-02 09:12

双木的木的博客多模型融合是一种“集百家之所长”的方法，非常受大众喜爱，比如在Kaggle比赛中就经常会用到各种各样的多模型融合实例。其实多模型融合的内容不仅仅局限于本章所介绍的内容，因为本章讲到的只是用于模型输出结果的...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 10月31日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 10月23日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 10月21日

悬赏问题

¥15 Stata链式中介效应代码修改
¥15 latex投稿显示click download
¥15 请问读取环境变量文件失败是什么原因？
¥15 在若依框架下实现人脸识别
¥15 添加组件无法加载页面,某块加载卡住
¥15 网络科学导论，网络控制
¥15 利用Sentinel-2和Landsat8做一个水库的长时序NDVI的对比，为什么Snetinel-2计算的结果最小值特别小，而Lansat8就很平均
¥15 metadata提取的PDF元数据，如何转换为一个Excel
¥15 关于arduino编程toCharArray()函数的使用
¥100 vc++混合CEF采用CLR方式编译报错

为什么在pytorch中使用VGG16不用预训练，自己从头训练猫狗分类，正确率只有74%就上不去了？

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新