【深度学习】使用自己写的VGG16网络训练精度不提升

本人根据VGG16的模型自己写了个VGG16的网络，但是用它进行训练的时候，精度一直不变，换用pytorch官方的VGG16就精度会从低到高变化，所以感觉问题不在我的训练方法上，请问我这个网络模型哪里有问题吗？下面是网络代码

import torch
from torch import nn


class MyVGG16(nn.Module):
    def __init__(self, class_number):
        super(MyVGG16, self).__init__()
        self.block1 = nn.Sequential(
            nn.Conv2d(in_channels=3, out_channels=64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1)),
            nn.ReLU(inplace=True),
            nn.Conv2d(in_channels=64, out_channels=64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1)),
            nn.ReLU(inplace=True),
            nn.MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)
        )
        self.block2 = nn.Sequential(
            nn.Conv2d(in_channels=64, out_channels=128, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1)),
            nn.ReLU(),
            nn.Conv2d(in_channels=128, out_channels=128, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1)),
            nn.ReLU(),
            nn.MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1)
        )
        self.block3 = nn.Sequential(
            nn.Conv2d(in_channels=128, out_channels=256, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1)),
            nn.ReLU(),
            nn.Conv2d(in_channels=256, out_channels=256, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1)),
            nn.ReLU(),
            nn.Conv2d(in_channels=256, out_channels=256, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1)),
            nn.ReLU(),
            nn.MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1),
        )
        self.block4 = nn.Sequential(
            nn.Conv2d(256, 512, kernel_size=(3,3), padding=1),
            nn.ReLU(),
            nn.Conv2d(512, 512, kernel_size=(3,3), padding=1),
            nn.ReLU(),
            nn.Conv2d(512, 512, kernel_size=(3,3), padding=1),
            nn.ReLU(),
            nn.MaxPool2d(kernel_size=2, stride=2, padding=0),
        )
        self.block4 = nn.Sequential(
            nn.Conv2d(in_channels=256, out_channels=512, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1)),
            nn.ReLU(),
            nn.Conv2d(in_channels=512, out_channels=512, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1)),
            nn.ReLU(),
            nn.Conv2d(in_channels=512, out_channels=512, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1)),
            nn.ReLU(),
            nn.MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1),
        )
        self.block5 = nn.Sequential(
            nn.Conv2d(in_channels=512, out_channels=512, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1)),
            nn.ReLU(),
            nn.Conv2d(in_channels=512, out_channels=512, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1)),
            nn.ReLU(),
            nn.Conv2d(in_channels=512, out_channels=512, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1)),
            nn.ReLU(),
            nn.MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1),
        )
        self.block6 = nn.Sequential(
            nn.Flatten(),
            nn.Linear(in_features=512 * 7 * 7, out_features=4096),
            nn.ReLU(),
            nn.Dropout(p=0.5, inplace=False),
            nn.Linear(in_features=4096, out_features=4096),
            nn.ReLU(),
            nn.Dropout(p=0.5, inplace=False),
            nn.Linear(in_features=4096, out_features=1000),
             
            # 因为这是一个class_number分类问题，所以输出class_number
            nn.Linear(1000, class_number),
            
            # UserWarning: Implicit dimension choice for softmax has been deprecated. Change the call to include dim=X as an argument.
            # 加上dim消除警告
            nn.Softmax(dim=1)
        )

    def forward(self, input):
        output = self.block1(input)
        output = self.block2(output)
        output = self.block3(output)
        output = self.block4(output)
        output = self.block5(output)
        output = self.block6(output)
        return output

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
别来BUG求求了 2022-06-06 06:59
关注
删除最后的softmax层，在内个relu之前加归一化就好了

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

报告相同问题？

关注问题

【深度学习】使用自己写的VGG16网络训练精度不提升 pytorch 深度学习神经网络
2022-05-30 00:00

回答 2 已采纳删除最后的softmax层，在内个relu之前加归一化就好了
为什么在pytorch中使用VGG16不用预训练，自己从头训练猫狗分类，正确率只有74%就上不去了？ pytorch 深度学习神经网络
2021-10-21 23:53

回答 1 已采纳官方pretrain的模型数据集是imagenet，样本数是你这个数据集的很多倍，这样的vgg网络卷积层的参数基本收敛到比较好的一个情况，你直接用来finetune只要稍微微调一下最后的fc层就可以得
tensorflow2.x 深度学习 使用相同梯度进行梯度下降的两个相同神经网络，得到的结果却不同 tensorflow 深度学习神经网络
2021-03-12 00:07

回答 2 已采纳在上面给的代码的第164行处插入 optimizer = optimizers.Adam(lr=1e-4) 重新初始化optimizer，这样两个模型训练后的测试结果就一样了，望采纳
【深度学习】VGG16网络结构复现 | pytorch |
2022-11-14 19:32

今天一定要洛必达的博客【深度学习】VGG16网络结构复现 | pytorch |
【深度学习】如何绘制网络模型图深度学习神经网络
2023-03-20 15:19

回答 2 已采纳请看👉 ：如何绘制深度学习模型图？
vgg16每次跑出的结果都相同 tensorflow 深度学习神经网络
2022-04-01 02:02

回答 1 已采纳可以调整参数，多运行几次（cpu跟gpu不影响结果，只是gpu运行快一点）
vgg19训练图像分类，分成两类，这样训练出来的网络是否过拟合了？人工智能机器学习深度学习
2021-03-23 15:58

回答 3 已采纳 1k5左右就差不多了，过拟合的话不一定，要看下有没有防止过拟合的手段，如果你的项目是开源项目的话，一般会有这方面的限制的。
深度学习-Pytorch实现经典VGGNet网络
2024-03-04 12:17

Alex_StarSky的博客 深度学习中，经典网络引领一波又一波的技术革命，从LetNet到当前最火的GPT所用的Transformer，它们把AI技术不断推向高潮。2012年AlexNet大放异彩，它把深度学习技术引领第一个高峰，打开人们的视野。 2014年，牛津...
torchvision中预训练的VGG16和一般论文里的VGG-VD-16有什么区别 pytorch 图像处理深度学习
2023-04-06 16:16

回答 1 已采纳 VGG16 和 VGG-VD-16 在网络结构上是有区别的。VGG16 是 VGG 网络的一种实现，而 VGG-VD-16 则是 VGG 网络的一种变体。 PyTorch 中的 torchvision
Vgg16模型分析图片输出的向量维度可以改变吗？机器学习深度学习自然语言处理
2023-03-18 02:20

回答 5 已采纳参考GPT和自己的思路： Vgg16模型是一个预训练的深度卷积神经网络，它由若干个卷积层和池化层构成。在输入一张图片后，模型会输出一个特征向量，该向量的维度通常为1000，用来表示该图片的分类信息。这
深度学习中，模型的准确率飘忽不定是什么回事 python 深度学习神经网络
2023-02-19 15:09

回答 2 已采纳模型的准确率飘忽不定可能有以下几个原因： 1.数据集不足：如果数据集很小，模型可能无法充分地学习数据集中的特征，因此准确率可能会随着不同的训练数据集的变化而变化。 2.模型结构：如果模型结构不合适，可
VGGNet 论文精度，并解析 VGG-16 网络模型结构
2022-06-20 21:49

Flying Bulldog的博客《VERY DEEP CONVOLUTIONAL NETWORKSFOR LARGE-SCALE IMAGE RECOGNITION》所以我们用3个3×3的卷积叠层代替...（3）最后，多个卷积堆叠在一起可以使得模型的深度增加，证明了本文章的结论：深度在视觉表征中的重要性。.
特征提取网络是如何训练和评估的机器学习深度学习神经网络
2022-04-18 16:27

回答 1 已采纳例如最开始的imageNet，是由学者提出的深度网络结构，结构上有众多参数，初始化了参数之后，成为了一个经典的特征提取网络，到后来的深度残差网络resnet，这些网络都是一个模板，你可以利用这些模板来
使用Vgg16模型训练效果不佳，分类的效果就跟没有训练一样，不管多少epoch都是一样。
2022-11-26 22:56

文文戴的博客使用Vgg16模型训练效果不佳，分类的效果就跟没有训练一样，不管多少epoch都是一样。
深度学习——使用块的网络VGG（笔记）
2022-12-05 18:20

小奶糕的笔记本的博客使用块的网络VGG1.AlexNet比LeNet更深更大来得到精度，能不能更深和更大?选项：①更多的全连接层（太贵）②更多的卷积层③将卷积层组合成块2.VGG块的选择①深或者宽?5*5卷积3*3卷积选择深且窄的效果更好②VGG块3*3...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 6月14日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 6月6日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 5月30日

悬赏问题

¥15 如何在node.js中或者java中给wav格式的音频编码成sil格式呢
¥15 不小心不正规的开发公司导致不给我们y码，
¥15 我的代码无法在vc++中运行呀，错误很多
¥50 求一个win系统下运行的可自动抓取arm64架构deb安装包和其依赖包的软件。
¥60 fail to initialize keyboard hotkeys through kernel.0000000000
¥30 ppOCRLabel导出识别结果失败
¥15 Centos7 / PETGEM
¥15 csmar数据进行spss描述性统计分析
¥15 各位请问平行检验趋势图这样要怎么调整？说标准差差异太大了
¥15 delphi webbrowser组件网页下拉菜单自动选择问题

【深度学习】使用自己写的VGG16网络训练精度不提升

2条回答 默认 最新

问题事件

悬赏问题

2条回答默认最新