pytorch ，Cifar10 ，Lenet5 ，损失函数不收敛

import torch
import torch.nn as nn
import torch.nn.functional as F
import torch.optim as optim

import torchvision
import torchvision.transforms as transforms
import torchvision.datasets as datasets

import time

#归一化处理
## Compose 是创建
transform = transforms.Compose([transforms.ToTensor(),#把数据转换成tensor
                                transforms.Normalize((0.5,0.5,0.5),(0.5,0.5,0.5)) #数据归一化 ，第一组参数是所有channel的平均值,第2组参数是方差
                                                             # 为什么需要平均值的原因是 ，所有图片都有的 ，数据不需要学习，因为平均值都在每张图片里了是干扰项目
                                ])
#训练数据
## 数据在哪
train_data = datasets.CIFAR10('./data',train=True,transform=transform,download=True)
## 数据加载
train_loader = torch.utils.data.DataLoader(dataset=train_data,batch_size=4,shuffle=True,num_workers=2)

#测试数据
## 数据在哪里
test_data =  datasets.CIFAR10('./test',train=False,transform=transform,download=True)
##数据加载
test_loader = torch.utils.data.DataLoader(dataset=test_data,batch_size=4,shuffle=True,num_workers=2)

# min-batch的图片显示
import matplotlib.pyplot as plt
import numpy as np
## 一般显示图片都是numpy array的数据来进行显示的
def imgsshow(img):  ##?  这里有个包升级的问题 ，导致目前没有解决
    img = img/2 + 0.5  #由于在归一化 transform里有去掉平均的处理 在这里需要变回来
    img = img.numpy() # numpay array
    img = np.transpose(img,(1,2,0)) # (c,h,w) -> (h,w,c) 符合正常显示的数据的方式
    plt.show(img)
data_iter = iter(train_loader) #随机加载一个min batch
images , labels = data_iter.next() # 把图片 和 label 分开
# imgsshow(torchvision.utils.make_grid(images))

class Net(nn.Module):
    def __init__(self):
        super(Net,self).__init__()
        # LeCun
        # N = (input_size - kernel_size + 2 padding)/stripe +1
        self.conv1 = nn.Sequential(nn.Conv2d(3,6,5,1),  # out =  (32 -5 + 2*0)/1+1 =28
                                   nn.ReLU(),
                                   nn.MaxPool2d(kernel_size=2,stride=2))  # out = 14
        self.conv2 = nn.Sequential(
           nn.Conv2d(6,16,5), # out = (14 -5 +0)1 +1  =10
            nn.ReLU(),
            nn.MaxPool2d(kernel_size=2,stride =2)  # out = 10/2  = 5
        )


        self.fc1 = nn.Sequential(
            nn.Linear(16*5*5,120),
            nn.ReLU()
        )
        self.fc2 = nn.Sequential(
            nn.Linear(120,84),
            nn.ReLU()
        )
        self.fc3 = nn.Linear(84,10)
    def forward(self, x):
        x = self.conv1(x)
        x = self.conv2(x)

        x = x.view(-1, 16*5*5)
        print ("%%"*50)
        print ('dimision  change',x.shape)
        x = self.fc1(x)
        x = self.fc2(x)
        x = self.fc3(x)
        return x
net = Net()
print("current net is ",net)
# 定义损失
criterion = nn.CrossEntropyLoss()
#定义优化器 ，（一旦损失backforward 后，如何更新 weight ，已经更新谁的weight）
tunner = optim.SGD(net.parameters(),lr=0.0001,momentum=0.9)
traning_loss_history = []
test_loss_history = []
for epoch in range(1000):
    net.train()
    running_loss = 0.0
    print ("training.... epoch{0}".format(epoch))
    start_epoc = time.time()
    for i ,data in enumerate(train_loader,0): #一次仅仅提取一个minbatch ，一致到所有的数据取完
        batch_time = time.time()
        imges, labels = data
        # imges, labels = Variable(images),Variable(labels)
        tunner.zero_grad()
        outs = net(images)
        loss = criterion(outs, labels)
        # tunner.zero_grad()
        loss.backward()
        tunner.step()
        if i % 1000 == 0:
            print ("i {0} : loss {1} : duration {2}".format(i, loss.item(), (time.time()-batch_time)))
        running_loss += loss.item()
        if i%250 == 0 :
            net.eval()
            with torch.no_grad():
                for data in test_loader:
                    test_images ,test_label = data
                    test_outs = net(test_images)
                    test_loss = criterion(test_outs,test_label)
            traning_loss_history .append(running_loss/250)
            test_loss_history.append(test_loss.item())
            running_loss = 0.0


    print("epoch {0} :: loss {1} :: duration {2}".format(epoch,loss.item(),time.time()-start_epoc))
    # 为什么损失函数会有regression呢 ？ 原因 1 ，minbatch的偶然性导致 ，比如这几次都是飞机 2, learning rrate {}
#画图

plt.figure()
plt.plot(traning_loss_history)
plt.plot(test_loss_history)
plt.legend('training loss','test loss')
plt.tile("Traing /Test loss")
plt.xlabel('#mini_batch *250')
plt.ylabel('Loss')

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
threenewbee 2020-04-01 08:56
关注
换个损失函数或者激活函数看看，另外看下你的y列（标签）是否有问题

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

pytorch的resnet猫狗大战跑不完不收敛 python pytorch 机器学习
2022-07-22 12:31

回答 3 已采纳跑得慢是因为没有使用cuda加速
pytorch 的安装。想不改动cuda版本 python pytorch 人工智能
2022-10-27 18:56

回答 2 已采纳 Pytorch-gpu版安装教程【注意：无需提前安装cuda和cudnn】_山风wind的博客-CSDN博客_pytorch一定要cuda吗
yolov5中v4.0版本版本如何替换为DIou_nms,以及更改损失函数为ciou pytorch 深度学习目标检测
2021-07-16 11:26

回答 2 已采纳 #utils/general.py def bbox_iou(box1, box2, x1y1x2y2=True, GIoU=False, DIoU=False, CIoU=False, eps=1e
CNN卷积神经网络02--LeNet训练CIFAR10
2023-12-02 01:25

zyy_0724的博客网络加载,损失函数反向传播优化器的设置,按batchsize取出数据,进行前向传播,计算损失,反向传播更新网络,评估代码,日志代码,保存网络等。此处的均值及标准差是先验的,是统计的结果,人为设定的,并不是训练网络必须要...
pytorch函数拟合出现的问题 pytorch 神经网络
2022-11-16 16:44

回答 4 已采纳问题出在你不应该将函数名命名为train，因为你本身继承的是nn.Module()这个类，如果你去看源码说明的话，你会发现这个类本身有个函数脚train，model.train()的意思是将模型转成训
pytorch在pycharm中调用不出来 pycharm python pytorch
2023-03-02 16:17

回答 2 已采纳应该是你pycharm里面配置的python解释器与系统path环境下的不是同一个python解释器，去pycahrm设置里面改一下
pytorch不调用gpu运算 pytorch 深度学习
2022-11-11 16:14

回答 2 已采纳给你找了一篇非常好的博客，你可以看看是否有帮助，链接：pytorch无法调用gpu的一些解决方法
pytorch学习14：使用CIFAR10数据训练LetNet模型
2021-08-24 22:01

HMTT的博客工具方法和一些设置这里有一个帮助显示图片的方法和解决图片不显示问题的设置...# Error #15: Initializing libiomp5md.dll... import os os.environ['KMP_DUPLICATE_LIB_OK'] = 'TRUE' def imshow(img): """ 展示
如何将这个pytorch自带的CE函数优化？解决样本不均衡问题？ python pytorch 有问必答神经网络
2021-09-12 17:14

回答 2 已采纳你好，我是有问必答小助手，非常抱歉，本次您提出的有问必答问题，技术专家团超时未为您做出解答本次提问扣除的有问必答次数，已经为您补发到账户，我们后续会持续优化，扩大我们的服务范围，为您带来更好地服务。
有什么方法可以减少pytorch的permute函数运行的时间？ c++ pytorch
2022-11-28 16:32

回答 2 已采纳我认为唯一主要的加速将发生于并行。如果您因为cpu受限问题，那么利用多核是至关重要的。试着让每一行通过不同的（线程/进程）。当然，这会引起更多的问题，例如数据是否需要按照输入文件中的相同顺序排列。
卸载pytorch能不能直接删除相关文件 python pytorch
2022-10-27 15:11

回答 2 已采纳如果你用的conda的虚拟环境，直接conda路径下面有个Anaconda3\envs文件，里面找到虚拟环境名直接删除整个文件夹就行。如果你安装在base环境，就没得法子了，除非你重装conda
Pytorch官方Demo——LeNet（详细注释）
2023-11-15 14:47

m0_53955985的博客对LeNet代码实现详细讲解
为啥始终不能用gpu跑pytorch框架 pytorch 机器学习深度学习
2022-10-28 11:16

回答 1 已采纳显存占用多少？不要看显卡使用率，这个是平均使用率，如果模型小数据少，使用率低很正常
HBU-NNDL 实验六卷积神经网络（5）使用预训练resnet18实现CIFAR-10分类
2022-11-09 08:53

不是蒋承翰的博客 resnet cifar10
NNDL 实验六卷积神经网络（5）使用预训练resnet18实现CIFAR-10分类
2022-11-10 23:43

别被打脸的博客这次我还是写很细，写了很长时间，我这次改GPU改了好长时间，一开始以为是电脑出问题，因为训练的很慢，后来才发现是没有全转到GPU上去，建议训练之前重启电脑清一下...最后，写的不太好，请老师和各位大佬多教教我。
没有解决我的问题, 去提问

悬赏问题

¥15 delta降尺度计算的一些细节，有偿
¥15 Arduino红外遥控代码有问题
¥15 数值计算离散正交多项式
¥30 数值计算均差系数编程
¥15 redis-full-check比较两个集群的数据出错
¥15 Matlab编程问题
¥15 训练的多模态特征融合模型准确度很低怎么办
¥15 kylin启动报错log4j类冲突
¥15 超声波模块测距控制点灯，灯的闪烁很不稳定，经过调试发现测的距离偏大
¥15 import arcpy出现importing _arcgisscripting 找不到相关程序

pytorch ，Cifar10 ，Lenet5 ，损失函数不收敛

2条回答 默认 最新

悬赏问题

2条回答默认最新