crnn训练完最后验证时报错StopIteration

训练代码如下


from __future__ import print_function
from __future__ import division

import argparse
import random
import torch
import torch.backends.cudnn as cudnn
import torch.optim as optim
import torch.utils.data
import numpy as np
import os
from lib.models.crnn import CRNN
from lib.models.crnn import BidirectionalLSTM
from lib import dataset, utils
# from synalphabet import alphabet
from modify import alphabet   # 合成数据和真实数据
from torch.utils.tensorboard import SummaryWriter
import time

# 配置参数
parser = argparse.ArgumentParser()
parser.add_argument('--trainRoot', help='path to dataset', default='') 
parser.add_argument('--valRoot', help='path to dataset', default='')
parser.add_argument('--workers', type=int, help='number of data loading workers', default=0)
parser.add_argument('--batchSize', type=int, default=64, help='input batch size')
parser.add_argument('--imgH', type=int, default=32, help='the height of the input image to network')
parser.add_argument('--imgW', type=int, default=100, help='the width of the input image to network')
parser.add_argument('--nh', type=int, default=256, help='size of the lstm hidden state')
parser.add_argument('--nepoch', type=int, default=2, help='number of epochs to train for')
# TODO(meijieru): epoch -> iter
parser.add_argument('--cuda', action='store_true', help='enables cuda')
parser.add_argument('--ngpu', type=int, default=1, help='number of GPUs to use')
parser.add_argument('--pretrained', default='', help="path to pretrained model (to continue training)")
parser.add_argument('--alphabet', type=str, default='E:\\Thesis\\recognition\\crnn\\modify.py')
parser.add_argument('--expr_dir', default='expr', help='Where to store samples and models')
parser.add_argument('--displayInterval', type=int, default=200, help='Interval to be displayed')
parser.add_argument('--n_test_disp', type=int, default=10, help='Number of samples to display when test')
parser.add_argument('--valInterval', type=int, default=200, help='Interval to be displayed')
parser.add_argument('--saveInterval', type=int, default=200, help='Interval to be displayed')
parser.add_argument('--lr', type=float, default=0.0001, help='learning rate for Critic, not used by adadealta')
parser.add_argument('--beta1', type=float, default=0.5, help='beta1 for adam. default=0.5')
parser.add_argument('--adam', action='store_true', help='Whether to use adam (default is rmsprop)')
parser.add_argument('--adadelta', action='store_true', help='Whether to use adadelta (default is rmsprop)')
parser.add_argument('--keep_ratio', action='store_true', help='whether to keep ratio for image resize')
parser.add_argument('--manualSeed', type=int, default=1234, help='reproduce experiemnt')
parser.add_argument('--random_sample', action='store_true', help='whether to sample the dataset with random sampler')
parser.add_argument('--output', default='', help='')
parser.add_argument('--rootdir', default='', help='')
opt = parser.parse_args()

# 英文字典
# alphabet = '0123456789abcdefghijklmnopqrstuvwxyz'

# 创建输出文件夹
if not os.path.exists(opt.expr_dir):
    os.makedirs(opt.expr_dir)

# 设置随机种子
random.seed(opt.manualSeed)
np.random.seed(opt.manualSeed)
torch.manual_seed(opt.manualSeed)
torch.cuda.manual_seed(opt.manualSeed)
torch.cuda.manual_seed_all(opt.manualSeed)
cudnn.benchmark = True
torch.backends.cudnn.deterministic = True

# 训练变量
image = torch.FloatTensor(opt.batchSize, 3, opt.imgH, opt.imgH)  # 图片尺寸
text = torch.IntTensor(opt.batchSize * 10)  # 假设每个句子长为5
length = torch.IntTensor(opt.batchSize)

# 输出类别数，即字符个数+空白符
nclass = len(alphabet) + 1
# 输入Channel
nc = 1

# 修改为指定字典集，使用英文字典时忽略大小写
converter = utils.strLabelConverter(alphabet, ignore_case=True)
# CTCLoss
criterion = torch.nn.CTCLoss()

log_path='{}\\{}'.format(opt.output,str(int(time.time())))
if not os.path.exists(log_path):
    os.makedirs(log_path)
logger=utils.get_logger('{}\\log.txt'.format(log_path))

log_dir_path=os.path.join(opt.rootdir,'logs')
if not os.path.exists(log_dir_path):
    os.makedirs(log_dir_path)
tfb_log_dir = os.path.join(log_dir_path, str(int(time.time())))
if not os.path.exists(tfb_log_dir):
        os.makedirs(tfb_log_dir)
writer_dict=SummaryWriter(tfb_log_dir)

# 创建crnn模型
crnn = CRNN(opt.imgH, nc, nclass, opt.nh)

if opt.cuda:
    crnn.cuda()
    image = image.cuda()
    criterion = criterion.cuda()

# custom weights initialization called on crnn
def weights_init(m):
    classname = m.__class__.__name__
    if classname.find('Conv') != -1:
        m.weight.data.normal_(0.0, 0.02)
    elif classname.find('BatchNorm') != -1:
        m.weight.data.normal_(1.0, 0.02)
        m.bias.data.fill_(0)


def val(val_set, max_iter=100, flag=False):
    print('Start val')

    data_loader = torch.utils.data.DataLoader(
        val_set, shuffle=True, batch_size=opt.batchSize, num_workers=int(opt.workers))
    val_iter = iter(data_loader)

    n_correct = 0
    loss_avg = utils.averager()
    if not flag:
        max_iter = min(max_iter, len(data_loader))
    else:
        max_iter = max(max_iter, len(data_loader))

    for i in range(max_iter):
        data = next(val_iter)
        cpu_images, cpu_texts = data
        batch_size = cpu_images.size(0)
        utils.loadData(image, cpu_images)
        t, l = converter.encode(cpu_texts)
        utils.loadData(text, t)
        utils.loadData(length, l)

        with torch.no_grad():
            crnn.eval()
            preds = crnn(image)
            crnn.train()

        preds_size = torch.IntTensor([preds.size(0)] * batch_size)
        cost = criterion(preds, text, preds_size, length)
        loss_avg.add(cost)

        _, preds = preds.max(2)
        preds = preds.transpose(1, 0).contiguous().view(-1)
        sim_preds = converter.decode(preds.data, preds_size.data, raw=False)
        for pred, target in zip(sim_preds, cpu_texts):
            target = target.lower()  # 在编码阶段忽略了大小写，计算预测与标签准确率时也需要忽略
            if pred == target:
                n_correct += 1

    if not flag:
        raw_preds = converter.decode(preds.data, preds_size.data, raw=True)[:opt.n_test_disp]
        for raw_pred, pred, gt in zip(raw_preds, sim_preds, cpu_texts):
            print('%-20s => %-20s, gt: %-20s' % (raw_pred, pred, gt))

    accuracy = n_correct / float(max_iter * opt.batchSize)
    if flag:
        logger.info('Test loss: {:.7f}, accuracy: {:.7f}'.format(loss_avg.val(), accuracy))
    else:
        logger.info('Val loss: {:.7f}, accuracy: {:.7f}'.format(loss_avg.val(), accuracy))

def train():
    # 模型权重初始化
    crnn.apply(weights_init)

    # 如果指定预训练模型则加载
    if opt.pretrained != '':
        logger.info('loading pretrained model from {}'.format(opt.pretrained))
        crnn.load_state_dict(torch.load(opt.pretrained))

    logger.info("Start training!")
    logger.info('dataset is: {}'.format(opt.trainRoot))
    # loss averager
    loss_avg = utils.averager()

    # setup optimizer 从头训练
    if opt.adam:
        optimizer = optim.Adam(crnn.parameters(), lr=opt.lr,
                               betas=(opt.beta1, 0.999))
    elif opt.adadelta:
        optimizer = optim.Adadelta(crnn.parameters())
    else:
        optimizer = optim.RMSprop(crnn.parameters(), lr=opt.lr)

    # # 微调
    # for name,param in crnn.named_parameters():
    #     if 'rnn' in name:
    #         param.requires_grad=True
    # crnn.rnn = torch.nn.Sequential(
    #         BidirectionalLSTM(512, opt.nh, opt.nh),
    #         BidirectionalLSTM(opt.nh, opt.nh, nclass))   # .cuda()
    # optimizer = optim.Adam(crnn.rnn.parameters(), lr=opt.lr,
    #                        betas=(opt.beta1, 0.999))
    
    # 学习率衰减
    scheduler = optim.lr_scheduler.MultiStepLR(optimizer,
                                               milestones=[2, 4, 6, 8, 10, 12, 14, 16, 18, 20],
                                               gamma=0.65)
    # scheduler = optim.lr_scheduler.MultiStepLR(optimizer,
    #                                            milestones=[2, 4, 6, 8, 10],
    #                                            gamma=0.65)

    # 检查设备
    if torch.cuda.is_available() and not opt.cuda:
        print("WARNING: You have a CUDA device, so you should probably run with --cuda")

    # 加载数据集
    train_dataset = dataset.lmdbDataset(root=opt.trainRoot)
    assert train_dataset

    train_loader = torch.utils.data.DataLoader(
        train_dataset, batch_size=opt.batchSize,
        shuffle=True,
        num_workers=int(opt.workers),
        collate_fn=dataset.alignCollate(imgH=opt.imgH, imgW=opt.imgW, keep_ratio=opt.keep_ratio))

    test_dataset = dataset.lmdbDataset(
        root=opt.valRoot, transform=dataset.resizeNormalize((100, 32)))

    # 训练1个batch
    def train_batch():
        data = next(train_iter)
        cpu_images, cpu_texts = data
        batch_size = cpu_images.size(0)
        utils.loadData(image, cpu_images)
        t, l = converter.encode(cpu_texts)
        utils.loadData(text, t)
        utils.loadData(length, l)

        preds = crnn(image)
        preds_size = torch.IntTensor([preds.size(0)] * batch_size)
        loss = criterion(preds, text, preds_size, length)
        crnn.zero_grad()
        loss.backward()
        optimizer.step()
        return loss

    for epoch in range(opt.nepoch):
        train_iter = iter(train_loader)
        i = 0
        while i < len(train_loader):
            crnn.train()
            cost = train_batch()
            loss_avg.add(cost)
            i += 1

            if i % opt.displayInterval == 0:
                logger.info('[{}/{}][{}/{}] Loss:{:.7f}'.format(epoch, opt.nepoch, i, len(train_loader), loss_avg.val()))
                loss_avg.reset()
            writer_dict.add_scalar('train_loss', loss_avg.val(), epoch)

            if i % opt.valInterval == 0:
                val(test_dataset)

            time_str = time.strftime('%m%d')
            # do checkpointing
            if i % opt.saveInterval == 0:
                torch.save(
                    crnn.state_dict(), '{0}/1CRNN{1}.pth'.format(opt.expr_dir,time_str))
        scheduler.step()

    # test
      val(test_dataset, flag=True)

if __name__ == '__main__':
    train()

训练完最后一轮，采用所有数据进行最后测试的时候，执行 val(test_dataset, flag=True)，在def val()中，data =next( val_iter)报错StopIteration。训练的每一轮过程中 val(test_dataset)部分并没有任何问题，想请问一下是什么原因导致的？

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
IT工程师_二师兄 2023-07-31 11:06
关注
你把报错信息复制出来发给我

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

crnn-master.zip_CRNN_crnn 训练_文字识别_神经网络识别
2022-09-24 08:55

这个“crnn-master.zip”压缩包包含了一个名为“crnn-master”的项目，该项目可能是一个完整的CRNN实现，用于训练和识别图像中的文字。在图像识别领域，传统的方法通常依赖于手工特征提取，如SIFT、HOG等，然后...
CRNN预训练参数（训练集10000张左右）
2022-05-25 21:17

标题中的“CRNN预训练参数”指的是已经通过大量数据训练好的CRNN模型的权重和配置，这些参数可以作为基础，帮助我们更快地对新的OCR任务进行微调，而无需从零开始训练模型。描述中提到，这个预训练模型是基于0-9、...
训练Pytorch深度学习模型出现StopIteration
2024-06-04 22:52

Andrew_Xzw的博客训练Pytorch深度学习模型出现StopIteration
crnn.pth crnn 预训练模型
2021-03-16 09:33

crnn 预训练模型
中文OCR训练与测试 CRNN(CNN+RNN+CTCLoss)
2023-01-09 11:34

训练 1.处理train 数据集 python3 ./utils/make_data.py 2.训练网络 python3 train.py 测试 1.加载模型，将训练好的模型放入./model/中 2.向test_img_list中添加需要测试的图片列表 test_img_list = ['/home/tony/...
crnn实现水平和垂直方向中文文字识别, 提供在3w多个中文字符训练的水平识别和垂直识别的预训练模型.zip
2024-01-06 22:01

模型训练时，通常采用CTC（Connectionist Temporal Classification）损失函数，它允许输入序列与目标序列的长度不一致，适合于无固定时间步长的序列标注问题。在完成训练后，我们会得到一个预训练模型，可以应用于...
CRNN-基于Pytorch实现卷积循环网络CRNN-附项目源码+预训练模型下载-优质项目实战.zip
2024-10-20 18:41

CRNN_基于Pytorch实现卷积循环网络CRNN_附项目源码+预训练模型下载_优质项目实战
一个生成crnn训练数据集的工具，主要针对简体中文。_TextRecognitionDataGenerator.zip
2024-09-16 22:30

一个生成crnn训练数据集的工具，主要针对简体中文。_TextRecognitionDataGenerator
基于yolov5+CRNN的中文车牌识别系统源码+训练好的模型数据集（高分项目）
2024-10-29 14:56

基于yolov5+CRNN的中文车牌识别系统源码+训练好的模型数据集（高分项目）基于yolov5+CRNN的中文车牌识别系统源码+训练好的模型数据集（高分项目）基于yolov5+CRNN的中文车牌识别系统源码+训练好的模型数据集（高分...
CRNN.zip（win10可用）
2020-07-31 15:30

- Python：作为主要的编程语言。 - PyTorch：深度学习框架，用于构建和训练CRNN模型。 - torchvision：PyTorch的扩展库，用于处理图像数据。 - numpy：用于数值计算。 - PIL或OpenCV：用于图像处理。 - torchtext：...
汉字识别-基于CRNN的中文汉字识别-附模型下载+训练数据集下载+项目源码-优质项目实战.zip
2024-05-17 13:18

项目源码包含模型训练、验证和测试的全过程，这为开发者提供了深入理解CRNN工作原理的机会。通过阅读和运行代码，可以了解如何预处理图像、构建神经网络模型、定义损失函数和优化器、以及如何在训练集上迭代模型并...
59张可用于生成CRNN模型训练数据的背景图片
2022-10-24 11:35

在训练CRNN模型时，数据集的构建至关重要。描述中的"59张可用于生成CRNN模型训练数据的背景图片"意味着我们有59种不同的背景图像，这些图像可能包含了各种文档类型和纸张纹理，比如空白纸、笔记纸、报纸、信纸等。每...
CRNN_CRNN_文本识别_
2021-10-03 09:40

CRNN的核心思想是结合了卷积神经网络（CNN）和循环神经网络（RNN），利用CNN的强大特征提取能力处理图像，再通过RNN（特别是长短时记忆网络LSTM或门控循环单元GRU）处理序列信息。CNN部分负责从输入图像中提取视觉...
crnn.rar_CRNN的算法_crnn数字识别_中文字符识别_字符识别_深度学习 crnn
2022-09-20 11:14

6. **训练过程**：在训练CRNN模型时，通常需要大量的带标签的字符图像作为输入，这些图像可能来自于扫描文档、车牌、屏幕截图等。通过反向传播优化网络权重，使得模型能够从输入图像中准确地预测出字符序列。 7. **...
tensorflow-crnn:tensorflow slim实现crnn
2021-05-23 01:10

Tensorflow slim实现卷积循环神经网络（CRNN），用于基于图像的序列识别任务，例如场景文本识别和OCR。安装 pip install -r requirements.txt 例子 captcha生成图像看起来像这样训练有素的模型可以从下载完整...
CRNN文本识别.zip
2021-08-02 14:45

在车牌识别中，CRNN首先通过CNN层提取图像特征，然后通过RNN（例如LSTM或GRU）处理特征序列，预测出每个字符，最后通过解码器将字符序列化。这个过程需要对图像进行预处理，例如灰度化、二值化和大小标准化，以优化...
算法部署-使用Libtorch部署Pytorch训练出来的CRNN不定长文本序列识别模型-附项目源码-优质项目实战.zip
2024-10-18 16:58

算法部署_使用Libtorch部署Pytorch训练出来的CRNN不定长文本序列识别模型_附项目源码_优质项目实战
理解文本识别网络CRNN
2023-12-28 17:21

CRNN 全称为 Convolutional Recurrent Neural Network，主要用于端到端地对不定长的文本序列进行识别，不用先对单个文字进行切割，而是将文本识别转化为时序依赖的序列学习问题，就是基于图像的序列识别。...
基于yolov5+CRNN的中文车牌识别系统
2024-02-05 22:03

首先，CNN负责提取图像特征，然后通过一个连接层将特征图转化为序列，最后RNN（通常使用长短时记忆网络LSTM）对序列进行解码，识别出文字。这种结合图像处理和序列建模的方法使得CRNN在识别连续的字符序列，如车牌号...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已结题（查看结题原因） 7月31日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 7月31日

悬赏问题

¥15 yolov5目标检测并显示目标出现的时间或视频帧
¥15 电视版的优酷可以设置电影连续播放吗？
¥50 复现论文；matlab代码编写
¥30 echarts 3d地图怎么实现一进来页面散点数据和卡片一起轮播
¥15 数字图像的降噪滤波增强
¥15 心碎了，为啥我的神经网络训练的时候第二个批次反向传播会报错呀，第一个批次都没有问题
¥15 MSR2680-XS路由器频繁卡顿问题
¥15 VB6可以成功读取的文件，用C#读不了
¥15 如何使用micpyhon解析Modbus RTU返回指定站号的湿度值，并确保正确？
¥15 C++ 句柄后台鼠标拖动如何实现

crnn训练完最后验证时报错StopIteration

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新