在用VGG训练猫狗分类中，不用预训练权重，loss值一直保持在0.69附近，如何解决？


from torch import nn
from torchvision import models,datasets,transforms
import torch
import os
from torch.autograd import Variable
from torch.optim.lr_scheduler import *


data_dir = 'data'
data_transform = {
    'train':transforms.Compose([transforms.Resize((150, 150)),
                          transforms.ToTensor(),
                          transforms.Normalize([0.485,0.456,0.406], [0.229,0.224,0.225]),
                          transforms.RandomHorizontalFlip(p=0.5),#水平翻转
                          transforms.RandomRotation(50),  # 随机旋转
                          transforms.RandomResizedCrop(150)
                          ]),
        'valid':transforms.Compose([transforms.Resize((150, 150)),
                          transforms.ToTensor(),
                          transforms.Normalize([0.485,0.456,0.406], [0.229,0.224,0.225])
                          ])
}

image_datasets = {x:datasets.ImageFolder(root=os.path.join(data_dir, x), transform=data_transform[x])
                    for x in ['train','valid']
                    }

dataloader = {x:torch.utils.data.DataLoader(dataset=image_datasets[x], batch_size=30, shuffle=True, num_workers=4)
              for x in ['train','valid']
}

x_example, y_example = next(iter(dataloader['train']))
example_classes = image_datasets['train'].classes
index_classes = image_datasets['train'].class_to_idx

model = models.vgg16(pretrained=False)


# 遍历模型中的所有模块
for m in model.modules():
    # 如果当前模块是卷积层或者线性层
    if isinstance(m, nn.Conv2d):
        nn.init.kaiming_normal_(m.weight)
        if m.bias is not None:
            nn.init.constant_(m.bias, 0)
    elif isinstance(m, nn.Linear):
        nn.init.xavier_normal_(m.weight)
        nn.init.constant_(m.bias, 0)


model.classifier = torch.nn.Sequential(
    torch.nn.Linear(25088,512),
    torch.nn.ReLU(),
    torch.nn.Dropout(p=0.5),
    torch.nn.Linear(512,512),
    torch.nn.ReLU(),
    torch.nn.Dropout(p=0.5),
    torch.nn.Linear(512,2)
)

use_gpu = torch.cuda.is_available()
if use_gpu :
    model = model.cuda()


loss_f = torch.nn.CrossEntropyLoss()
optimizer = torch.optim.Adam(model.classifier.parameters(), lr=1e-5)

epochs = 99999

global_step = 0
best_acc = 0
best_epoch = 0

with open("loss2.txt", "w") as f:
    for epoch in range(epochs):
        print('----' * 10)
        print('Epoch {}/{}'.format(epoch + 1, epochs))

        for phase in ['train', 'valid']:
            if phase == 'train':
                print('Training...')
                model.train(True)

            else:
                print('Validing...')
                model.train(False)

            running_loss = 0.0
            running_corrects = 0

            for batch, data in enumerate(dataloader[phase]):

            #x为数据，y为标签
                x, y = data
                x, y = Variable(x.cuda()), Variable(y.cuda())
            #得到30个输出预测
                y_pred = model(x)
            #pred为预测结果
                _, pred = torch.max(y_pred.data, 1)
                loss = loss_f(y_pred, y)
                for per in y_pred.data:
                    print(per)
                running_loss += loss.data
                if phase == 'train':
                    global_step += 1
                    optimizer.zero_grad()
                    loss.backward()
                    optimizer.step()
                running_corrects += torch.sum(pred == y.data)
                    



            epoch_loss = running_loss * 30 / len(image_datasets[phase])
            epoch_acc = 100 * running_corrects / len(image_datasets[phase])


            print('{} Loss:{} ACC:{}'.format(phase, epoch_loss, epoch_acc))
            if(phase == 'train'):
                f.writelines([str(epoch), ',', str(epoch_loss.item()),',',str(epoch_acc.item()), ','])
                
            if(phase == 'valid'):
                f.writelines([str(epoch_acc.item()),',',str(epoch_loss.item()), ';'])
                f.flush()
                if epoch_acc.item() > best_acc:
                    torch.save(model, 'best3.pth')
                    best_acc = epoch_acc.item()
                    best_epoch = epoch
                    print('最好的正确率是epoch：', best_epoch+1, '    正确率为：', best_acc)


print('最好的模型在epoch：', best_epoch)
torch.save(model, 'vggmodel2.pth')

数据集在这里
链接：

百度网盘请输入提取码百度网盘为您提供文件的网络备份、同步和分享服务。空间大、速度快、安全稳固，支持教育网加速，支持手机端。注册使用百度网盘即可享受免费存储空间

https://pan.baidu.com/s/1UwpRbpqoB6tXOU-syPsVFQ

提取码：gbuh

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

星空下0516 2021-10-23 19:34

关注

这里有一个比较好的参数设置，我之前用到过，可以自己对比一下不同，另外你的0.69也很巧合，与log(0.5)的值很接近，可以调查一下。我之前学习的代码，精度能达到0.99左右。

import matplotlib.pyplot as plt

import torch
from torch import nn
from torch import optim
import torch.nn.functional as F
from torchvision import datasets, transforms, models


data_dir = '../data' #DOWNLOAD DATA FOR THIS

train_transforms = transforms.Compose([transforms.RandomRotation(30),
                                       transforms.RandomResizedCrop(224),
                                       transforms.RandomHorizontalFlip(),
                                       transforms.ToTensor(),
                                       transforms.Normalize([0.485, 0.456, 0.406],
                                                            [0.229, 0.224, 0.225])])

test_transforms = transforms.Compose([transforms.Resize(255),
                                      transforms.CenterCrop(224),
                                      transforms.ToTensor(),
                                      transforms.Normalize([0.485, 0.456, 0.406],
                                                           [0.229, 0.224, 0.225])])

train_data = datasets.ImageFolder(data_dir + '/train', transform=train_transforms)
test_data = datasets.ImageFolder(data_dir + '/test', transform=test_transforms)

trainloader = torch.utils.data.DataLoader(train_data, batch_size=64, shuffle=True)
testloader = torch.utils.data.DataLoader(test_data, batch_size=64)


model = models.densenet121(pretrained=True)
print(model)

for param in model.parameters():
    param.requires_grad = False

from collections import OrderedDict
classifier = nn.Sequential(OrderedDict([
                          ('fc1', nn.Linear(1024, 512)),
                          ('relu1', nn.ReLU()),
                          ('fc2', nn.Linear(512,256)),
                          ('relu2', nn.ReLU()),
                          ('fc3', nn.Linear(256, 2)),
                          ('output', nn.LogSoftmax(dim=1))
                          ]))
    
model.classifier = classifier


# Use GPU if it's available
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")

model = models.densenet121(pretrained=True)

# Freeze parameters so we don't backprop through them
for param in model.parameters():
    param.requires_grad = False
    
model.classifier = nn.Sequential(nn.Linear(1024, 512),
                                 nn.ReLU(),
                                 nn.Dropout(0.2),
                                 nn.Linear(512, 256),
                                 nn.ReLU(),
                                 nn.Dropout(0.1),
                                 nn.Linear(256, 2),
                                 nn.LogSoftmax(dim=1))

criterion = nn.NLLLoss()

# Only train the classifier parameters, feature parameters are frozen
optimizer = optim.Adam(model.classifier.parameters(), lr=0.003)

model.to(device);

traininglosses = []
testinglosses = []
testaccuracy = []
totalsteps = []
epochs = 1
steps = 0
running_loss = 0
print_every = 5
for epoch in range(epochs):
    for inputs, labels in trainloader:
        steps += 1
        inputs, labels = inputs.to(device), labels.to(device)
        
        optimizer.zero_grad()
        
        logps = model.forward(inputs)
        loss = criterion(logps, labels)
        loss.backward()
        optimizer.step()

        running_loss += loss.item()
        
        if steps % print_every == 0:
            test_loss = 0
            accuracy = 0
            model.eval()
            with torch.no_grad():
                for inputs, labels in testloader:
                    inputs, labels = inputs.to(device), labels.to(device)
                    logps = model.forward(inputs)
                    batch_loss = criterion(logps, labels)
                    
                    test_loss += batch_loss.item()
                    
                    # Calculate accuracy
                    ps = torch.exp(logps)
                    top_p, top_class = ps.topk(1, dim=1)
                    equals = top_class == labels.view(*top_class.shape)
                    accuracy += torch.mean(equals.type(torch.FloatTensor)).item()
            
            traininglosses.append(running_loss/print_every)
            testinglosses.append(test_loss/len(testloader))
            testaccuracy.append(accuracy/len(testloader))
            totalsteps.append(steps)
            print(f"Device {device}.."
                  f"Epoch {epoch+1}/{epochs}.. "
                  f"Step {steps}.. "
                  f"Train loss: {running_loss/print_every:.3f}.. "
                  f"Test loss: {test_loss/len(testloader):.3f}.. "
                  f"Test accuracy: {accuracy/len(testloader):.3f}")
            running_loss = 0
            model.train()

from matplotlib import pyplot as plt
plt.plot(totalsteps, traininglosses, label='Train Loss')
plt.plot(totalsteps, testinglosses, label='Test Loss')
plt.plot(totalsteps, testaccuracy, label='Test Accuracy')
plt.legend()
plt.grid()
plt.show()

如果有用，请采纳，谢谢！

报告相同问题？

关注问题

人工智能_预训练_VGGNet16_图像识别模型预训练权重_可重调
2022-02-13 23:58

VGGNet16是深度学习领域中一个经典且影响力深远的卷积神经网络（CNN）架构，由英国的Visual Geometry Group...在深度学习实践中，预训练模型和权重文件是极其重要的工具，可以帮助开发人员快速构建和优化自己的模型。
VGGnet16预训练模型
2022-01-21 12:35

在Python的深度学习库如TensorFlow或Keras中，都有现成的接口可以加载和使用VGG16预训练模型。通过调整模型的最后几层，可以将其应用于具有不同类别数目的新任务，这在计算机视觉领域是非常常见且实用的方法。
VGG16精简全连接层预训练模型
2025-06-13 12:26

在PyTorch框架中，"vgg16_reducedfc.pth" 是VGG16模型的一个预训练权重文件。预训练模型是指在大型数据集（如ImageNet）上预先训练完成的模型，可用于迁移学习，即在新的任务或较小数据集上进行微调，从而提升模型...
利用vgg-1619预训练模型提取图片的特征.zip
2024-01-06 21:52

这是基于 tensorflow-vgg16 和 Caffe 到 Tensorflow 的 VGG 19 和 VGG 16 的 Tensorflow 实现。原始的 Caffe 实现可以在这里和这里找到。我们修改了 tensorflow-vgg16 的实现，以使用 numpy 加载而不是默认的 ...
VGG模型详解与预训练[项目代码]
2025-11-14 11:11

在使用预训练模型时，查看模型的参数是重要的一步，它可以帮助我们理解模型是如何被训练的，以及如何在后续的任务中利用和微调这些参数。文章提供的代码示例和注意事项，为读者在实际操作中提供了指导和帮助。 ...
人工智能模型应用-使用kaggle手动搭建VGG16实现宝可梦图片五分类，对VGG16预训练参数进行再次训练
2025-05-15 10:35

在这个过程中，我们将会采用预训练的方法，即首先加载VGG16的预训练参数，然后通过在宝可梦数据集上进行再次训练，使得模型能够更好地适应新的分类任务。构建VGG16模型的过程可以分为几个关键步骤。首先，需要准备...
基于vgg16神经网络实现的图像分类任务pytorch代码、包含预训练权重
2024-12-10 15:24

在深度学习领域，图像分类一直是研究的热点，而卷积神经网络（CNN）在这一领域中起到了关键作用。vgg16是OxfordNet的变种，由Karen Simonyan和Andrew Zisserman在2014年的论文《Very Deep Convolutional Networks ...
tensorflow中VGG、mobienet、ResNet等预训练权重
2024-05-24 17:34

在预训练过程中，深度学习模型通过学习数据中的特征和模式来调整其参数，使其能够更好地拟合数据。预训练结束后，会生成一组最优的模型参数（即权重矩阵和偏置向量），这些参数可以被用来初始化其他任务的模型参数，...
基于tensorflow框架，用训练好的Vgg16模型，实现猫狗图像分类的代码.zip
2024-03-28 18:05

在本项目中，我们将探讨如何使用预训练的VGG16模型在TensorFlow框架下进行猫狗图像分类。VGG16是深度学习领域中一个经典的卷积神经网络（CNN）模型，最初由牛津大学视觉几何组（VGG）在2014年的ImageNet竞赛中提出。...
猫狗分类模型（使用VGG-13网络训练所得）
2021-02-24 21:57

标题中的“猫狗分类模型（使用VGG-13网络训练所得）”指的是一个深度学习模型，该模型专门设计用于区分图像中的猫和狗。VGG-13是深度学习领域一个经典且知名的卷积神经网络（Convolutional Neural Network, CNN）...
浅谈keras使用预训练模型vgg16分类,损失和准确度不变
2020-09-16 14:00

在本文中，我们将深入探讨如何在Keras中利用预训练的VGG16模型进行图像分类，以及在训练过程中遇到的损失和准确度保持不变的问题。VGG16是一种经典的深度学习模型，由牛津大学视觉几何组（VGG）提出，它在ImageNet...
VGG16做二分类时loss维持0.69不降解决办法
2024-04-14 17:14

Melvin1018的博客在使用VGG16做二分类任务（如猫和狗分类）时，可能会遇到这种情况：损失值loss总是维持在0.69，或者准确率恒等于50%，无论如何调整学习率（尝试过0.001、0.0001和0.00001），loss始终不降。一种简单的解决办法在每个...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已结题（查看结题原因） 10月24日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 10月23日

在用VGG训练猫狗分类中，不用预训练权重，loss值一直保持在0.69附近，如何解决？

2条回答 默认 最新

问题事件

2条回答默认最新