torch模型重新载入准确率很低，基本上不能预测

pytorch训练模型
训练集和验证集准确率都快100，然后用torch.save保存模型，之后再读取模型重新预测，模型基本上准确率不超过50%，有时是0%或者1%。用训练集和验证集测试也是相同的结果，都很低。但如果把预测代码放到train文件的末尾，又能正常预测。
训练代码

import scipy.io as sio
from torch.utils.data import TensorDataset, DataLoader
import numpy as np
import torch
from torch.autograd import Variable
import matplotlib.pyplot as plt
SEED = 1
np.random.seed(SEED)
torch.manual_seed(SEED)
torch.cuda.manual_seed_all(SEED)
torch.backends.cudnn.deterministic = True
torch.backends.cudnn.benchmark = False
from tqdm import tqdm

from model.conv_ince_resnet import *
from dataloader import *

batch_size = 64
num_epochs = 20

train_data,train_label,test_data, test_label,c= datagenerator('dataset/train.h5','dataset/trainlabel.txt','dataset/test.h5', 'dataset/testlabel.txt')

num_train_instances = len(train_data)
train_label = np.array(train_label)
train_data = torch.from_numpy(train_data).type(torch.FloatTensor)
train_label = torch.from_numpy(train_label).type(torch.LongTensor)
train_data = train_data.view(num_train_instances, 1, -1)
train_label = train_label.view(num_train_instances, 1)

train_dataset = TensorDataset(train_data, train_label)
train_data_loader = DataLoader(dataset=train_dataset, batch_size=batch_size, shuffle=True)



num_test_instances = len(test_data)
test_label = np.array(test_label)
test_data = torch.from_numpy(test_data).type(torch.FloatTensor)
test_label = torch.from_numpy(test_label).type(torch.LongTensor)
test_data = test_data.view(num_test_instances, 1, -1)
test_label = test_label.view(num_test_instances, 1)

test_dataset = TensorDataset(test_data, test_label)
test_data_loader = DataLoader(dataset=test_dataset, batch_size=64, shuffle=True)


msresnet = MSResNet(input_channel=13545, layers=[1, 1, 1, 1], num_classes=c)
msresnet = msresnet.cuda()

trace_module = torch.torch.jit.script(msresnet)
print(trace_module.code)

criterion = nn.CrossEntropyLoss().cuda()


optimizer = torch.optim.Adam(msresnet.parameters(), lr=0.001)
scheduler = torch.optim.lr_scheduler.MultiStepLR(optimizer, milestones=[300, 500, 600, 700, 800, 900], gamma=0.1)
train_loss = np.zeros([num_epochs, 1])
test_loss = np.zeros([num_epochs, 1])
train_acc = np.zeros([num_epochs, 1])
test_acc = np.zeros([num_epochs, 1])

for epoch in range(num_epochs):
    print('Epoch:', epoch)
    msresnet.train()
    scheduler.step(epoch)
    # for i, (samples, labels) in enumerate(train_data_loader):
    loss_x = 0
    for (samples, labels) in tqdm(train_data_loader):
        samplesV = Variable(samples.cuda())
        labels = labels.squeeze()
        labelsV = Variable(labels.cuda())

        # Forward + Backward + Optimize

        predict_label = msresnet(samplesV)
        optimizer.zero_grad()
        loss = criterion(predict_label[0], labelsV)

        loss_x += loss.item()

        loss.backward()
        optimizer.step()



    train_loss[epoch] = loss_x / num_train_instances
    print('trainloss:',train_loss[epoch])

    msresnet.eval()
    correct_train = 0
    for i, (samples, labels) in enumerate(train_data_loader):
        with torch.no_grad():
            samplesV = Variable(samples.cuda())
            labels = labels.squeeze()
            labelsV = Variable(labels.cuda())


            predict_label = msresnet(samplesV)
            prediction = predict_label[0].data.max(1)[1]
            correct_train += prediction.eq(labelsV.data.long()).sum()

            loss = criterion(predict_label[0], labelsV)


    print("Training accuracy:", (100*float(correct_train)/num_train_instances))

    train_acc[epoch] = 100*float(correct_train)/num_train_instances

    trainacc = str(100*float(correct_train)/num_train_instances)[0:6]


    loss_x = 0
    correct_test = 0
    for i, (samples, labels) in enumerate(test_data_loader):
        with torch.no_grad():
            samplesV = Variable(samples.cuda())
            labels = labels.squeeze()
            labelsV = Variable(labels.cuda())
            # labelsV = labelsV.view(-1)

        predict_label = msresnet(samplesV)
        prediction = predict_label[0].data.max(1)[1]
        correct_test += prediction.eq(labelsV.data.long()).sum()

        loss = criterion(predict_label[0], labelsV)
        loss_x += loss.item()

    print("Test accuracy:", (100 * float(correct_test) / num_test_instances))

    test_loss[epoch] = loss_x / num_test_instances
    test_acc[epoch] = 100 * float(correct_test) / num_test_instances
    print('valloss:', test_loss[epoch])
    testacc = str(100 * float(correct_test) / num_test_instances)[0:6]

    if epoch == 0:
        temp_test = correct_test
        temp_train = correct_train
    elif correct_test>temp_test:
        torch.save(msresnet, 'weights/changingResnet/ChaningSpeed_Train' + trainacc + 'Test' + testacc + '.pkl')
        temp_test = correct_test
        temp_train = correct_train
    torch.save(msresnet, 'weights/changingResnet/ChaningSpeed.pkl')
sio.savemat('result/changingResnet/TrainLoss_' + 'ChangingSpeed_Train' + str(100*float(temp_train)/num_train_instances)[0:6] + 'Test' + str(100*float(temp_test)/num_test_instances)[0:6] + '.mat', {'train_loss': train_loss})
sio.savemat('result/changingResnet/TestLoss_' + 'ChangingSpeed_Train' + str(100*float(temp_train)/num_train_instances)[0:6] + 'Test' + str(100*float(temp_test)/num_test_instances)[0:6] + '.mat', {'test_loss': test_loss})
sio.savemat('result/changingResnet/TrainAccuracy_' + 'ChangingSpeed_Train' + str(100*float(temp_train)/num_train_instances)[0:6] + 'Test' + str(100*float(temp_test)/num_test_instances)[0:6] + '.mat', {'train_acc': train_acc})
sio.savemat('result/changingResnet/TestAccuracy_' + 'ChangingSpeed_Train' + str(100*float(temp_train)/num_train_instances)[0:6] + 'Test' + str(100*float(temp_test)/num_test_instances)[0:6] + '.mat', {'test_acc': test_acc})
print(str(100*float(temp_test)/num_test_instances)[0:6])
plt.figure('1')
plt.plot(train_loss)
plt.show()
plt.figure('2')
plt.plot(test_loss)
plt.show()
plt.figure('3')
plt.plot(train_acc)
plt.show()
plt.figure('4')
plt.plot(test_acc)
plt.show()

测试代码

import scipy.io as sio
from torch.utils.data import TensorDataset, DataLoader
import numpy as np
import torch
import torch.nn as nn
from torch.autograd import Variable
import torch.nn.functional as F
import matplotlib.pyplot as plt
import math
import time
import torch
from torch import nn
from torch.autograd import Variable
import numpy as np
import matplotlib.pyplot as plt
import scipy.io as sio
from torch.utils.data import TensorDataset, DataLoader
import numpy as np
import torch
import torch.nn as nn
from torch.autograd import Variable
import torch.nn.functional as F
import matplotlib.pyplot as plt
import math
import time
from tqdm import tqdm
from dataloader import *
train_data,train_label,test_data, test_label,c= datagenerator('dataset/train.h5','dataset/trainlabel.txt','dataset/test.h5', 'dataset/testlabel.txt')

batch_size = 100

num_test_instances = len(test_data)

test_data = torch.from_numpy(test_data).type(torch.FloatTensor)
test_label = np.array(test_label)
test_label = torch.from_numpy(test_label).type(torch.LongTensor)
test_data = test_data.view(num_test_instances, 1, -1)
test_label = test_label.view(num_test_instances, 1)

test_dataset = TensorDataset(test_data, test_label)
test_data_loader = DataLoader(dataset=test_dataset, batch_size=batch_size, shuffle=True)

msresnet = torch.load('weights/changingResnet/ChaningSpeed.pkl')
a = msresnet.state_dict()

msresnet = msresnet.cuda()
msresnet.eval()

correct_test = 0
for i, (samples, labels) in enumerate(test_data_loader):
    with torch.no_grad():
        samplesV = Variable(samples.cuda())
        labels = labels.squeeze()
        labelsV = Variable(labels.cuda())
        # labelsV = labelsV.view(-1)
    predict_label = msresnet(samplesV)
    prediction = predict_label[0].data.max(1)[1]
    correct_test += prediction.eq(labelsV.data.long()).sum()

print("Test accuracy:", (100 * float(correct_test) / num_test_instances))

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
影醉阏轩窗 2021-07-09 09:39
关注
放那么大段代码，是让人给你debug嘛？这是很简单的问题，直接对比训练集和测试集的模型参数即可。

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

可是最终用测试集验证模型却只有0.3的准确率，请问是怎么回事啊？ tensorflow 人工智能机器学习深度学习
2021-02-25 00:59

回答 4 已采纳模型的泛化能力不行，即训练集数据覆盖范围小了，并没有覆盖到大部分情况。举个例子来说，你训练的数据都是圆形的，你用来测试矩形，那肯定不行啊。
pt模型转torchscript模型 pytorch 人工智能深度学习
2022-05-05 21:26

回答 1 已采纳 torch.jit.save — PyTorch 1.11.0 documentation
关于安卓部署AI，现在手上只有一个torchscript android pytorch 人工智能
2022-04-25 16:48

回答 1 已采纳自问自答，目前进度是能使用模型处理图像。首先是关于模型：torchscript模型是可以通过pytorch.jit.load直接进行导入，可以通过netron.app查看模型的结构。Android提供
从零搭建pytorch模型教程（八）实践部分（一）微调、冻结网络
2024-07-25 10:52

AI大模型探索者的博客本文介绍了微调的概念，需要微调的情况，微调的步骤，...在讲关于模型的冻结、微调前，需要引入一个概念，叫迁移学习。迁移学习是指利用旧知识来学习新知识，主要目标是将已经学会的知识很快地迁移到一个新的领域中。
python中安装了torch_geometric但不能代码自动补全。 python
2022-10-04 11:33

回答 1 已采纳不知道你这个问题是否已经解决, 如果还没有解决的话: 关于该问题，我找了一篇非常好的博客，你可以看看是否有帮助，链接：Python安装torch模块报错处理除此之外, 这篇博客: python tor
为什么用torch保存模型占用磁盘那么大？怎么样保存模型占用磁盘空间小？ python pytorch 深度学习
2021-12-09 11:37

回答 1 已采纳保存成静态模型和参数就会比较小，也就是你的链接里面的torch.save(model.state_dict(), 'model_weights.pth')如果你是直接保存的话，里面除了模型之外，还会有
pytorch加载训练好的模型进行预测时，为什么又开始训练了 python 自然语言处理
2021-06-01 17:16

回答 2 已采纳因为你在run里的训练代码没有封装城函数，直接全局执行，import run.py 就开始xun lian le
Swift大模型微调以及批量推理验证
2024-06-07 17:08

大模型玩家的博客在深度学习和自然语言处理（NLP）领域，大规模语言模型如BERT、GPT-3等通过在大量数据上进行预训练获得了强大的语言理解和生成能力。这些预训练模型通常需要进行微调（Fine-tuning），以便在特定的下游任务上表现更...
找不到torch，求解😭 python 有问必答
2021-08-06 11:46

回答 1 已采纳不是一个解释器把，你看你是不是有其他环境啊。
安装torch时发生错误，不知道如何解决 python pytorch
2022-11-19 15:16

回答 2 已采纳 conda有时候就是会有些莫名其妙的问题，可以考虑重新创建一个虚拟环境。有可能anaconda出问题了，重新安装一个anaconda
为什么在pytorch中使用VGG16不用预训练，自己从头训练猫狗分类，正确率只有74%就上不去了？ pytorch 深度学习神经网络
2021-10-21 23:53

回答 1 已采纳官方pretrain的模型数据集是imagenet，样本数是你这个数据集的很多倍，这样的vgg网络卷积层的参数基本收敛到比较好的一个情况，你直接用来finetune只要稍微微调一下最后的fc层就可以得
大语言模型从零开始训练全面指南：预训练、Tokenizer训练、指令微调、奖励模型、强化学习
2024-08-26 14:29

和老莫一起学AI的博客在这篇文章中，我们将尽可能详细地梳理一个完整的 LLM 训练流程。包括模型预训练（Pretrain）、Tokenizer 训练、指令微调（Instruction Tuning）、奖励模型（Reward Model）和强化学习（RLHF）等环节。
pyinstaller 编译成exe 提示缺少torch_utils.pyc python 人工智能机器学习
2022-05-22 17:28

回答 2 已采纳你把utils文件夹复制到你打包的文件夹里面，然后把torch_utils.py复杂一份，改名为orch_utils.pyc就行。我也不知道这是为什么，但他就是能跑了
关于torch.fx的使用
2022-12-18 11:01

shelgi的博客首先去查看官网docTORCH.FXnn.Module这句话很好的定义了FX的本质：用来改变...从流程上看，FX与推理库都是解析模型生成IR，然后融合算子呀优化等等，但是FX只是为了优化改变模型的功能，最终落脚点还是在python上；
GPT3：语言模型在命名实体识别中的应用(GPT3:Applicationof GPT 3 in Named Entity Recognition
2023-07-26 00:24

光剑书架上的书的博客随着深度学习技术的不断推进，近年来基于神经网络的语言模型也逐渐火爆起来，实现了强大的预测能力。虽然传统的机器学习方法已经能够胜任很多复杂任务，但对于一些特定的任务，依靠传统的方法往往存在一些局限性，...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已结题（查看结题原因） 7月9日

悬赏问题

¥15 需要手写数字信号处理Dsp三个简单题不用太复杂
¥15 数字信号处理考试111
¥100 关于#audobe audition#的问题，如何解决？
¥15 allegro17.2生成bom表是空白的
¥15 请问一下怎么打通CAN通讯
¥20 如何在 rocky9.4 部署 CDH6.3.2？
¥35 navicat将excel中的数据导入mysql出错
¥15 rt-thread线程切换的问题
¥15 高通uboot 打印ubi init err 22
¥15 R语言中lasso回归报错

torch模型重新载入准确率很低，基本上不能预测

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新