跑训练集的时候出错，该怎么改呢

Traceback (most recent call last):
File "E:/Con-GAE-main/src/train.py", line 114, in <module>
train_loader = DataLoader(train_dataset, **params)
File "E:\Anaconda3\lib\site-packages\torch_geometric\data\dataloader.py", line 43, in __init__
super(DataLoader,
File "E:\Anaconda3\lib\site-packages\torch\utils\data\dataloader.py", line 266, in __init__
sampler = RandomSampler(dataset, generator=generator) # type: ignore
File "E:\Anaconda3\lib\site-packages\torch\utils\data\sampler.py", line 102, in __init__

import os

import torch
import numpy as np
from torch_geometric.data import Data

from sklearn.metrics import roc_curve, auc
import argparse
import os
import sys
import random
import torch.nn as nn
from torch.utils import data

import pandas as pd
import matplotlib.pyplot as plt 
from random import shuffle
import pickle
import torchvision.transforms as transforms
import time
from torch_geometric.data import InMemoryDataset, Dataset, Data, DataLoader
import math

from data_util import ConTrafficGraphDataset as trafficDataset
from model import ConGAE,ConGAE_t, ConGAE_sp, deepConGAE

parser = argparse.ArgumentParser()

# model
parser.add_argument('--model', default = 'ConGAE', help = 'Model type: ConGAE, ConGAE_t, ConGAE_sp, deepConGAE')
# training parameters
parser.add_argument('--randomseed',  type=int, default = 1)
parser.add_argument('--train_epoch', type =int, default = 150 , help = 'number of training epochs')
parser.add_argument('--lr', default = 5e-5 , help = 'learning rate')
parser.add_argument('--dropout_p', default = 0.2 , help = 'drop out rate')
parser.add_argument('--adj_drop', default = 0.2 , help = 'edge dropout rate')
parser.add_argument('--verbal', default = False, type = bool , help = 'print loss during training')
# 2-layer ConGAE parameters
parser.add_argument('--input_dim', type=int, default = 4, help = 'input feature dimension')
parser.add_argument('--n_nodes', type=int, default = 50, help = 'total number of nodes in the graph')
parser.add_argument('--node_dim1', type=int, default = 300, help = 'node embedding dimension of the first GCN layer')
parser.add_argument('--node_dim2', type=int, default = 150, help = 'node embedding dimension of the second GCN layer')
parser.add_argument('--encode_dim', type=int, default = 150, help = 'final graph embedding dimension of the Con-GAE encoder')
parser.add_argument('--hour_emb', type=int, default = 100, help = 'hour emnbedding dimension')
parser.add_argument('--week_emb', type=int, default = 100, help = 'week emnbedding dimension')
parser.add_argument('--decoder', type=str, default = 'concatDec', help = 'decoder type:concatDec, bilinearDec')
# deepConGAE parameters
parser.add_argument('--hidden_list', nargs="*", type=int, default = [300, 150], help = 'the node embedding dimension of each layer of GCN')
parser.add_argument('--decode_dim', type=int, default = 150, help = 'the node embedding dimension at decoding')

# files
parser.add_argument('--log_dir', default = '../log/' , help = 'directory to save model')

args = parser.parse_args()
print(args)


#Reproducability 
np.random.seed(seed=args.randomseed)
random.seed(args.randomseed)
torch.manual_seed(args.randomseed)


result_dir = args.log_dir + 'results/'
if not os.path.exists(result_dir):
    os.makedirs(result_dir)


# ## load data

dirName =  "../data/selected_50_orig/"
with open(dirName + 'partition_dict', 'rb') as file:
    partition = pickle.load(file)
    
# item_d: whihc time slice each id correspond to
with open(dirName + 'item_dict', 'rb') as file:
     item_d = pickle.load(file)

node_X = np.load(dirName + 'node_X.npy')
node_posx = np.mean(node_X[:, :2], 1)
node_posy =  np.mean(node_X[:, 2:], 1)

node_X = torch.from_numpy(node_X).float()
tt_min, tt_max =np.load(dirName + 'tt_minmax.npy' )


start_time = 0+24*23
end_time = 23+24*27

# reset partition
all_data = partition['train'] + partition['val']
partition_test = all_data[350:750] # includes NFL, 400 points, 30% are NFL
partition_val = all_data[:150]  
partition_train = all_data[150:350] + all_data[750:] # the rest


source_dir = dirName # full sample size (~2000)

# Parameters
params = {'batch_size': 10,
          'shuffle': True,
          'num_workers': 0}

params_val = {'batch_size': 10,
          'shuffle': False,
          'num_workers': 0}

root = '../data/selected_50_pg/root/'
# data loaders
train_dataset = trafficDataset(root, partition_train, node_X,  item_d, source_dir  )
test_dataset = trafficDataset(root, partition_test, node_X, item_d, source_dir)
val_dataset = trafficDataset(root, partition_val, node_X, item_d, source_dir)

train_loader = DataLoader(train_dataset, **params)
test_loader = DataLoader(test_dataset,**params_val )
val_loader = DataLoader(val_dataset,**params_val )


# ## load model
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")

if args.model == 'ConGAE_sp':
    model = ConGAE_sp(args.input_dim, args.node_dim1,args.node_dim2, args.dropout_p,args.adj_drop, decoder = args.decoder,  n_nodes = args.n_nodes)

    
if args.model == 'ConGAE_t':
    model = ConGAE_t(args.input_dim, args.node_dim1,args.node_dim2, args.dropout_p,args.adj_drop,decoder = args.decoder, hour_emb = args.hour_emb, week_emb = args.week_emb,n_nodes = args.n_nodes)

if args.model == 'ConGAE':
    model = ConGAE(input_feat_dim=args.input_dim, node_dim1 =args.node_dim1, node_dim2=args.node_dim2, encode_dim = args.encode_dim ,hour_emb = args.hour_emb, week_emb = args.week_emb, n_nodes = args.n_nodes)


if args.model ==  'deepConGAE':
    model = deepConGAE(args.input_dim, hidden_list = args.hidden_list, encode_dim = args.encode_dim,decode_dim = args.decode_dim, dropout = args.dropout_p, adj_drop = args.adj_drop, hour_emb = args.hour_emb, week_emb = args.week_emb,n_nodes = args.n_nodes)
    
model.float()


# specify optimizer
optimizer = torch.optim.Adam(model.parameters(), lr=args.lr)
criterion = nn.MSELoss()


def calc_rmse(recon_adj, adj, tt_min, tt_max):
    adj = adj * (tt_max - tt_min) + tt_min
    recon_adj = recon_adj * (tt_max - tt_min) + tt_min
    rmse = criterion(recon_adj, adj)
    return torch.sqrt(rmse)


def train(epoch, train_loader ,test_loader, best_val):
    model.train()
    train_loss = 0
    loss_train = []
    loss_val = []
    for graph_data in train_loader:
        graph_data = graph_data.to(device)
        optimizer.zero_grad()
        if args.model == 'ConGAE_sp':
            recon = model(graph_data.x, graph_data.edge_index, graph_data.edge_attr)
        else:
            recon = model(graph_data.x, graph_data.edge_index, graph_data.edge_attr,graph_data.hour, graph_data.week)
        loss = criterion(recon, graph_data.edge_attr)
        loss.backward()
        optimizer.step()
        loss_train.append(loss.item())
    for graph_val in val_loader:
        # evaluation
        model.eval()
        graph_val = graph_val.to(device)
        with torch.no_grad():
            if args.model == 'ConGAE_sp':
                recon_val = model(graph_val.x, graph_val.edge_index, graph_val.edge_attr)
            else:
                recon_val = model(graph_val.x, graph_val.edge_index, graph_val.edge_attr,                            graph_val.hour, graph_val.week)
            mse_val = criterion(recon_val, graph_val.edge_attr)
        loss_val.append(mse_val.item())
    
    loss_train = sum(loss_train) / len(loss_train)
    loss_val = sum(loss_val) / len(loss_val)
 
    # print results
    if args.verbal and epoch % 15 == 0:
        print('Train Epoch: {}  loss: {:e}  val_loss: {:e}'.format(
            epoch, loss_train, loss_val ))
        rmse =  math.sqrt(loss_val) * (tt_max - tt_min)
        print('validation travel time rmse mean: {:e}'.format(rmse))
    
    #  early-stopping
    if loss_val < best_val:
        torch.save({
            'epoch' : epoch,
            'model_state_dict': model.state_dict(),
            'optimizer_state_dict': optimizer.state_dict(),
        }, model_path)
        best_val = loss_val

    return  loss_train, loss_val, best_val


# ## Train

loss_track = []
val_track = []

model = model.to(device)
n_epochs = args.train_epoch
start = time.time()
best_val = float('inf') # for early stopping
model_path = args.log_dir + args.model  + '.pt'
lr_decay_step_size = 100

for epoch in range(1, n_epochs+1):
    train_loss, val_loss, best_val = train(epoch, train_loader, val_loader, best_val)
    loss_track.append(train_loss)
    val_track.append(val_loss)
    if epoch % lr_decay_step_size == 0:
        for param_group in optimizer.param_groups:
            param_group['lr'] = 0.5 * param_group['lr']
    
print("time for {} epochs: {:.3f} min".format(n_epochs, (time.time() - start)/60))


# plot learning curve
plt.plot(np.array(loss_track), label = 'traiing')
plt.plot(np.array(val_track), label = 'validaiton')
plt.title("loss")
plt.xlabel("# epoch")
plt.ylabel("MSE loss")
plt.legend()
# plt.ylim(0.4, 1)
# plt.show()
plt.savefig(result_dir + args.model +"_training_curve.png")


# save args config
with open(args.log_dir + args.model + '_args.pkl', 'wb') as fp:
    pickle.dump(args, fp)

if not isinstance(self.num_samples, int) or self.num_samples <= 0:
File "E:\Anaconda3\lib\site-packages\torch\utils\data\sampler.py", line 110, in num_samples
return len(self.data_source)
TypeError: 'NoneType' object cannot be interpreted as an integer

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
爱晚乏客游 2021-04-27 23:18
关注
检查下报错的那句看看data有没有。这个报错是指你的哪里是空的，不能遍历

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

手写图片集-人工智能训练集
2021-05-15 19:45

这是一个典型的人工智能和机器学习项目，尤其在图像处理领域中广泛应用，如OCR（光学字符识别）技术。我们将通过以下步骤来了解这个过程： 1. **数据预处理**：在开始之前，我们需要对手写图片进行预处理，包括...
AI-for-Security-Paper:人工智能和安全论文集
2021-04-25 16:13

"AI-for-Security-Paper"这一论文集，为我们揭示了人工智能在安全领域的重要角色，以及面临的挑战和未来的发展趋势。一、AI在安全检测中的应用 1. 威胁检测：AI技术如深度学习和机器学习，能够通过模式识别和异常...
Yolov5训练自己的数据集（详细完整版）
2021-12-03 16:32

缔宇diyu的博客新版小白式手把手完整无坑版教程。从安装yolov5、视频转图片、标注图片开始，到详细说明如何训练自己的数据集，训练时间、出现的多种问题说明、训练可视化、检测效果。
【证书】2025公益课，人工智能训练师-高级，知识点与题库（橙点同学）
2025-06-08 16:30

小哈里的博客【证书】2025公益课，人工智能训练师-高级，知识点与题库（橙点同学）文章目录 1、课程与考试介绍 2、知识点总结 2.1 知识点大纲 2.2 重点知识内容解析 2.3 课程例图 3、题库 3.1 单选题 3.2 判断题 3.3 多选题 1、...
硅谷重金押注“环境训练“技术推动AI智能体发展
2025-09-17 13:50

至顶科技的博客硅谷重金押注"环境训练"技术推动AI智能体发展
【人工智能】AI最终会取代程序员吗？
2024-08-10 06:00

越重天的博客这个令人难以置信的统计数据凸显了人工智能在软件工程中日益增长的影响力，并引发了一个问题：人工智能会彻底接管软件工程吗？人工智能技术正在蓬勃发展，有望实现大量编程任务的自动化。尽管人工智能可能会取代编码...
猪脸体态数据集.zip
2022-06-19 10:47

在当今的信息化时代，人工智能技术正在各个领域中发挥着越来越重要的作用，其中包括了农业。本数据集——"猪脸体态数据集.zip"，就是一个典型的例子，它展示了深度学习如何应用于畜牧业，特别是猪的健康管理与监控。...
给初学者的人工智能（AI）入门教程
2025-01-20 21:56

大名顶顶的博客如果你希望通过专家指导和支持以系统化的方式学习人工智能课程，可以关注我的博客，我会继续分享关于人工智能更多的知识，并给你提供有价值的关于AI应用和学习相关的信息。简单来说，深度学习是机器学习的一个子集，...
AI软件测试｜人工智能测试中对抗样本生成攻略
2024-07-26 19:00

daopuyun的博客这一阶段需要攻击者使用训练数据和对抗样本生成技术生成干扰样本。随着生成对抗样本的迭代算法涌现，对抗样本的生成方法日益丰富，大致包含基于梯度的生成方式如 FGSM、基于优化的生成方式如JSMA、基于GAN的生成方式...
AI安全01 人工智能的安全性
2024-07-14 14:38

m0_68282957的博客 GPT老师：是的，人工智能的普及不仅会导致部分职位的消失，还会促进一些职位的发展，更有可能产生许多新的职业。提问：可是人工智能的学习对象既然是人类群体，那么变得越来越像人类是不可避免的事情吧，终究有一天...
没有解决我的问题, 去提问

跑训练集的时候出错，该怎么改呢

1条回答 默认 最新

1条回答默认最新