for i , (input, label) in enumerate(dataloader)为什么会报indexerror：list index out of range

问题遇到的现象和发生背景

我在运行程序的训练部分的for i , (input, label) in enumerate(dataloader)是正常的，却在验证阶段的读取部分for i , (input, label) in enumerate(dataloader)报了indexerror：list index out of range错误，一直解决不了问题，还希望有大佬能指导一下。

问题相关代码，请勿粘贴截图


def validate(model, classifier, val_loader, criterion, epoch):

    # switch to evaluate mode
    model.eval()
    classifier.eval()

    batch_time = AverageMeter()
    data_time = AverageMeter()
    losses = AverageMeter()
    acc = AverageMeter()

    with torch.no_grad():

        end = time.time()

        # for batch_idx, (input, target) in enumerate(tqdm(val_loader, disable=False)):   #此处为报错点
        for batch_idx, (input, target) in enumerate(val_loader):                                        #此处为报错点

            #得到输入和标签信息
            input, target = input.float(), target.long()

            #将得到张量信息reshape
            input, target = input.reshape(-1, 3,224,224) , target.reshape(-1, )

            #放到GPU上
            input, target = input.cuda(), target.cuda()

            #计算output
            feats = model(input)
            output = classifier(feats)
            loss = criterion(output, target)

            #计算loss和acc
            batch_size = target.size(0)
            losses.update(loss.item(), batch_size)

            pred = torch.argmax(output, dim=1)
            acc.update(torch.sum(target == pred).item() / batch_size , batch_size)

            # 实耗时间计算
            batch_time.update(time.time() - end)
            end = time.time()

            #statistic
            if (batch_idx + 1)% 10 == 0:
                print('Val: [{0}][{1}/{2}]\t'
                'BT {batch_time.val:.3f} ({batch_time.avg:.3f})\t'
                      'DT {data_time.val:.3f} ({data_time.avg:.3f})\t'
                      'loss {loss.val:.3f} ({loss.avg:.3f})\t'
                      'acc {acc.val:.3f} ({acc.avg:.3f})'.format(
                    epoch, batch_idx + 1, len(val_loader), batch_time=batch_time, data_time=data_time, loss=losses,
                    acc=acc))
    return losses.avg, acc.avg

def train(model, classifier, train_loader, optimizer, epoch):
    model.train()
    classifier.train()

    batch_time = AverageMeter()
    data_time = AverageMeter()
    losses = AverageMeter()
    acc = AverageMeter()

    end = time.time

    for batch_idx, (input, target ) in enumerate(tqdm(train_loader, disable=False)):

        # Get inputs and target
        input, target = input.float(), target.long()

        #Reshape augmented tensors
        input, target = input.reshape(-1, 3, 224, 224), target.reshape(-1, )
        
        # Move the variables to cuda
        input, target = input.cuda(), target.cuda()
        
        # compute output
        feats = model(input)
        output = classifier(feats)
        
        ## Calculate the loss
        loss = F.cross_entropy(output, target, reduction= 'none')

        loss_sorted, indices = torch.sort(loss, descending=True)

        # Select top_K values for determining the hardness in mini-batch (alpha x batch_size)
        top_k = round(0.1 * target.size(0))

        # Caculate the adaptive hardness threshold 
        a = 0.7
        b = 0.2
        thres = a*(1-(batch_idx/len(train_loader))) + b

        # Select the hardness in each mini-batch based on the threshold (thres)
        hard_samples = loss_sorted[0:top_k]
        total_sum_hard_samples = sum(hard_samples)

        # Check whether total sum exceeds the threshold and update the loss accordingly (Eq. 2 in the paper)
        if total_sum_hard_samples > (thres * sum(loss_sorted)):
            output = output[indices, :]
            target = target[indices]
            top_k_output = output[0:top_k]
            tok_k_target = target[0:top_k]
            loss = F.cross_entropy(top_k_output, tok_k_target, reduction='mean')
            print(' curriculum loss')
        else:
            loss = F.cross_entropy(output, target, reduction='mean')

        # compute gradient and do SGD step #####
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()

        #compute loss and accuracy #####
        batch_size = target.size(0)
        losses.update(loss.item(), batch_size)

        pred = torch.argmax(output, dim=1)
        acc.update(torch.sum(target == pred).item() / batch_size, batch_size)

        # measure elapsed time ###
        batch_time.update(time.time() - end())
        end = time.time

        # print statistics and write summary every N batch
        if (batch_idx + 1) % 10 ==0:
            print('Train: [{0}][{1}]/[{2}]\t'
            'BT {batch_time.val:.3f} ({batch_time.avg:.3f}]\t'
            'DT {data_time.val:.3f} ({data_time.avg:.3f})\t'
            'loss {loss.val:.3f} ({loss.avg:.3f})\t'
            'acc {acc.val:.3f} ({acc.avg:.3f})'.format(
            epoch, batch_idx + 1, len(train_loader), batch_time=batch_time, data_time=data_time, loss=losses,
                acc=acc))
    return losses.avg,acc.avg

def main():

    mean , std = [0.485, 0.456, 0.406] , [0.229, 0.224, 0.225]
    transforms = T.Compose([
        T.Resize((224,224)),
        T.ToTensor(),
        T.Normalize(mean, std)
    ])
    dataset = ImageFolder(
        "H:\panqiwei-speaker\\birdsong recognition\\birdsimages",
        transform = transforms,
    )
    
    length = len(dataset)
    tr_len = int(0.7 * length)
    val_len = int((length - tr_len) / 2)
    te_len = length - tr_len - val_len

    tr_dataset, val_dataset, te_dataset = random_split(dataset, [tr_len, val_len, te_len])

    indices = list(range(tr_len))
    split = int(np.floor(val_len))
    np.random.shuffle(indices)
    train_idx, val_idx = indices[split:], indices[:split]

    train_sampler = SubsetRandomSampler(train_idx)
    val_sampler = SubsetRandomSampler(val_idx)

    print('total number of train samples in the dataset', len(train_idx))
    print('total number of val samples in the dataset', len(val_idx))

    #设置参数
    device = 'cuda' if torch.cuda.is_available() else 'cpu'
    params ={
        'batch_size': 128,
        'lr': 3e-4,
        'pre_training': False,
        'device': device,
        'checkpoint': False,
        'epochs': 200,
        'warm_up': False        
    }

    #加载
    tr_loader = DataLoader(tr_dataset, batch_size=params['batch_size'],
     shuffle=True if train_sampler is None else False,
     num_workers=0, pin_memory=True )
    val_loader = DataLoader(val_dataset, batch_size=params['batch_size'],sampler=val_sampler,
    shuffle=False, num_workers=0, pin_memory=True)
    te_loader = DataLoader(te_dataset, batch_size=params['batch_size'])
    loaders = [tr_loader, val_loader, te_loader]

    #网络模型
    # model = resnet34(pretrained=params['pre_training'], num_class=20).to(device)
    # train_epochs(model, loaders, params)

    model = net.TripletNet_Finetune('resnet18')

    state_dict = torch.load('./models/model_9_0.0289.pt')

    new_state_dict = OrderedDict()
    
    for k ,v in state_dict['model'].items():
        name = k[7:]
        new_state_dict[name] = v

    print('==> loading pre-trained model') 
    model.load_state_dict(new_state_dict,strict= False)


    idx = 0
    for layer_name, param in model.named_parameters():
        print(layer_name, '-->',idx)
        idx += 1

    for name, param in enumerate(model.named_parameters()):
        if name < 0:
            print("module", name,"was frozen")
            param = param[1]
            param.requires_grad = False

        else:
            print("module", name, "was not frozen")
            param = param[1]
            param.requires_grad = True
    
    print('==> finetuning classification')
    classifier = net.FinetuneResNet(20)

    # loss 
    criterion = nn.CrossEntropyLoss()

    if torch.cuda.is_available():
        model = model.cuda()
        criterion = criterion.cuda()
        classifier = classifier.cuda()
        cudnn.benchmark = True

    #optimizer 
    optimizer = optim.Adam(filter(lambda p : p.requires_grad, list(model.parameters()) + list(classifier.parameters())),lr= 3e-4,
    betas=(0.9,0.999), weight_decay=1e-4)
    scheduler = optim.lr_scheduler.MultiStepLR(optimizer, milestones=[20, 40, 60, 80], gamma = 0.95)

    #training model
    start_epoch = 1
    best_val_acc = -1

    if os.path.isfile('./Save_Result'):
        print("=> loading checkpoint '{}'".format('./Save_Result') )
        checkpoint = torch.load('./Save_Result')
        model.load_state_dict(checkpoint['model'])
        classifier.load_state_dict(checkpoint['classifier'])
        optimizer.load_state_dict(checkpoint['optimizer'])
        start_epoch = checkpoint['epoh'] +1 
        best_val_acc = checkpoint['val_acc']
        print("=> loaded checkpoint '{}' (epoch {})"
                .format('./Save_Result', checkpoint['epoch']))
        del checkpoint
        torch.cuda.empty_cache()
    else:
        print("=> no checkpoint found at '{}'".format('./Save_Result'))

    #start log 
    with open(os.path.join('./Save_Results/', 'fine_tuned_results.csv'), 'w') as f:
        f.write('epoch, train_loss, train_acc, val_loss, val_acc\n')

    #routine
    for epoch in range(start_epoch, 100 +1):
        
        time_start = time.time()

        train_losses, train_acc = train(model, classifier, tr_loader, optimizer, epoch)
        print('Epoch time:{:.2f} s.'.format(time.time() - time_start))

        print("==> validating the fine-tuned model ...")
        val_losses, val_acc = validate(model, classifier, val_loader, criterion, epoch)

        #log result
        with open(os.path.join('./Save_Results/', 'fine_tuned_results.csv'), 'a') as f:
            f.write('%03d,%0.6f,%0.6f,%0.6f,%0.6f,\n' % ((epoch + 1),train_losses, train_acc, val_losses, val_acc))

        scheduler.step()

        #save model every 10 epochs
        if epoch % 10 == 0:
            print('==> Saving ...')
            state = {
                'args': args,
                'model': model.state_dict(),
                'classifier': classifier.state_dict(),
                'optimizer': optimizer.state_dict(),
                'epoch': epoch,
                'train_loss': train_losses,
                'train_acc': train_acc,
                'val_acc': val_acc,
                'val_loss': val_losses
            }
            torch.save(state, '{}/fine_tuned_model_{}.pt'.format('./Save_Results/', epoch))

        #save model for the best val 
        if val_acc > best_val_acc:
            print('==> Saving...')
            state = {
                'args': args,
                'model': model.state_dict(),
                'classifier': classifier.state_dict(),
                'optimizer': optimizer.state_dict(),
                'epoch': epoch,
                'train_loss': train_losses,
                'train_acc': train_acc,
                'val_acc': val_acc,
                'val_loss': val_losses
            }
            torch.save(state, '{}/best_fine_tuned_model_{}.pt'.format('./Save_Results/', epoch))
            best_val_acc = val_acc

            #help release GPU memory
            del state
        torch.cuda.empty_cache()

if __name__ == "__main__" :

    seed = 42
    random.seed(seed)
    np.random.seed(seed)
    torch.manual_seed(seed)

    torch.cuda.manual_seed_all(seed)

    main()

运行结果及报错内容

IndexError：list index out of range

我的解答思路和尝试过的方法

我想要达到的结果

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

4条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
深度狂想 2023-05-18 16:16
关注
我也有相似的错误，最后发现是，测试时数据集用的是划分给测试的数据集，但分配给各个客户端用的是训练集的划分方案，就是说我用了训练集里的下标去取测试集的数据，自然可能越界。

解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

IndexError: list index out of range list python
2021-08-27 14:31

回答 3 已采纳你查下 from sklearn.svm import SVC svclf = SVC(kernel = 'linear') svclf.fit(x_train,y_train) preds = sv
使用DWY100k数据集对UEA进行测试，出现报错：IndexError: index 125000 is out of bounds for axis 0 with size 95500 python tensorflow 深度学习
2023-01-31 00:52

回答 4 已采纳这个错误是由于使用的数据集大小不匹配导致的。报错提示的 index 12500 超出了索引范围，数组大小为 95500。解决方案是检查数据集的大小是否与代码预期的大小匹配，并修正代码中的数据集引用，
请求大神帮帮我，加载MNIST数据集后，显示IndexError: too many indices for tensor of dimension 0 人工智能机器学习深度学习神经网络
2020-03-31 15:26

回答 2 已采纳把transforms.Normalize((0.1307),(0.3081))改为transforms.Normalize((0.1307,),(0.3081,))
行人重识别深度学习踩坑笔记
2020-07-31 22:29

爱吃蛋炒饭的小老鼠的博客 train函数中在for循环中进行enumerate（dataloader）时报错 Traceback (most recent call last): File "G:/行人重识别学习/try/train_class.py", line 245, in <module> main() File "G:/行人重识别学习/...
关于#python#的问题：在Jupyter Notebook上用pyecharts绘制的地图为什么不显色呢 python
2023-02-25 12:57

回答 7 已采纳因为你用的省份名称没有和地图的上匹配，比如北京市，湖南省，还有自治区的。名称必须和地图上的一致。
for j,value in zm.items():是什么意思？ python
2022-07-08 23:16

回答 3 已采纳你zm是个字典内容，它一个元素由两部分组成，键值对：key和valueitems()：以列表返回可遍历的(键, 值) 元组数组。for j,value in zm.items()，将一个元素的两个部分
py为什么input列表迭代不行？ list python
2022-06-27 16:40

回答 2 已采纳你把列表转int干啥直接a=eval(input())就行了
CaNet-master装载图片数据和mask（index对应单张图片序号）
2022-04-04 11:09

是七叔呀的博客 2. Dataset和Dataloader：首先自定义Dataset类重写__getitem__方法： index对应单张图片序号，batch_size不同也可能取到不同的类：1way−1shot\color{red}{1 way-1shot}1way−1shot # loading data # trainset ...
ValueError: too many values to unpack (expected 2) python 深度学习
2022-09-09 09:46

回答 4 已采纳 eat_pool, feat_fc = net(input, input, test_mode[1])这段话的net函数的返回值给多了，看下net的return几个变量
ValueError: invalid literal for int() with base 10: 'tri watch movi 的大问题 pycharm python
2022-04-21 20:53

回答 1 已采纳一个句子也就是str类型的，咋能转成int呀
python enumerate函数问题 list python
2020-01-02 22:13

回答 1 已采纳 `enumerate(list1)`是一个生成器对象，这个是python3的机制，生成器只有在调用的时候才会有显示，而 `list(enumerate(list1))`实际上是对生成器对象进行了一遍循
pytorch错误及解决方案
2021-04-15 14:47

康海东的博客 pytorch错误及解决方案 ...RuntimeError:invalid argument 5:k not in range for dimension at /pytorch/ate ... ValueError: optimizer got an empty parameter list The size of tensor a (197) must match the..
Python报错问题：SyntaxError: unknown parsing error。在练习有关csv数据下载 python 有问必答
2022-02-06 16:53

回答 2 已采纳 utf-16和utf-8不是同一种编码，改成utf-16编码来读取 import csv filename = 'sw_2022.csv' with open(filename, 'r', enco
Pytorch龙良曲实战代码与所遇问题解决
2023-05-21 18:37

BAB&的博客本文为个人学习Pytorch龙良曲版本时跟写的代码，碍于版本、环境等诸多原因，原视频中代码不能直接照搬。针对自己所遇到的问题进行了改动，与大家分享共勉。
open-vot：PyTorch 实现 Siamese-FC
2018-12-28 20:19

图波列夫的博客 open-vot 是一个基于 python 的目标跟踪库，其中实现了 KCF、SiamFC、GOTURN 等8种算法。该库采用模块化设计，利于不同算法的比较及扩展。本文主要介绍其中的 SiamFC 实现。运行要求代码运行需安装以下依赖包：...
mmdetection3改进cocoapi评估指标
2024-02-02 16:04

我还没秃头~的博客在训练自己的模型时，正常情况下只能打印评估指标，形式如下开启打印每一类...2.新建自己的，命名为,路径: 3.修改路径下的，主要是修改导包处改为修改后代码如下 4.修改文件 5.中开启测试打印完整效果运行时输出如下
ssd\融合代码\faster rcn\yolov5错误和笔记总结
2022-04-27 21:31

玄子的世界的博客 continue name = obj.find('name').text.lower().strip() bbox = obj.find('bndbox') pts = ['xmin', 'ymin', 'xmax', 'ymax'] bndbox = [] for i, pt in enumerate(pts): cur_pt = int(bbox.find(pt).text) - 1 # ...
一篇文章入门循环神经网络RNN
2022-11-05 12:48

一只楚楚猫的博客 text # 3、实例化，准备dataloader dataset = ImdbDataset(mode='train') dataloader = DataLoader(dataset=dataset, batch_size=2, shuffle=True,collate_fn=collate_fn) for idx, data in enumerate(dataloader):...
mmyolo尝试
2024-06-14 20:24

啊不卷的博客这是base.py的源码，地址是/home/lsw/miniconda3/envs/mmyolo/lib/python3.8/site-packages/mmdet/models/detectors/base.py。
【完结】cyのMemo（20240722~20240819）
2024-07-22 23:10

囚生CY的博客 In the case of NF4, the quantization levels are chosen to be evenly spaced in the range of the normalized weights. Dequantization: Although the weights are stored in 4-bit, they are dequantized ...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 3月18日

悬赏问题

¥50 求一位精通京东相关开发的专家
¥100 求懂行的大ge给小di解答下！
¥15 pcl运行在qt msvc2019环境运行效率低于visual studio 2019
¥15 MAUI,Zxing扫码，华为手机没反应。可提高悬赏
¥15 python运行报错 ModuleNotFoundError: No module named 'torch'
¥100 华为手机私有App后台保活
¥15 sqlserver中加密的密码字段查询问题
¥20 有谁能看看我coe文件到底哪儿有问题吗？
¥20 我的这个coe文件到底哪儿出问题了
¥15 matlab使用自定义函数时一直报错输入参数过多