pytorch数据加载，这个错误该怎么改

问题遇到的现象和发生背景

问题相关代码，请勿粘贴截图

import math
import torch
import torch.nn as nn
import torch.nn.functional as F

class TransformerModel(nn.Module):

def __init__(self, ntoken, ninp, nhead, nhid, nlayers, dropout=0.5):
    super(TransformerModel, self).__init__()
    from torch.nn import TransformerEncoder, TransformerEncoderLayer
    self.model_type = 'Transformer'
    self.pos_encoder = PositionalEncoding(ninp, dropout)
    encoder_layers = TransformerEncoderLayer(ninp, nhead, nhid, dropout)
    self.transformer_encoder = TransformerEncoder(encoder_layers, nlayers)
    self.encoder = nn.Embedding(ntoken, ninp)
    self.ninp = ninp
    self.decoder = nn.Linear(ninp, ntoken)

    self.init_weights()

def generate_square_subsequent_mask(self, sz):
    mask = (torch.triu(torch.ones(sz, sz)) == 1).transpose(0, 1)
    mask = mask.float().masked_fill(mask == 0, float('-inf')).masked_fill(mask == 1, float(0.0))
    return mask

def init_weights(self):
    initrange = 0.1
    self.encoder.weight.data.uniform_(-initrange, initrange)
    self.decoder.bias.data.zero_()
    self.decoder.weight.data.uniform_(-initrange, initrange)

def forward(self, src, src_mask):
    src = self.encoder(src) * math.sqrt(self.ninp)
    src = self.pos_encoder(src)
    output = self.transformer_encoder(src, src_mask)
    output = self.decoder(output)
    return output

class PositionalEncoding(nn.Module):

def __init__(self, d_model, dropout=0.1, max_len=5000):
    super(PositionalEncoding, self).__init__()
    self.dropout = nn.Dropout(p=dropout)

    pe = torch.zeros(max_len, d_model)
    position = torch.arange(0, max_len, dtype=torch.float).unsqueeze(1)
    div_term = torch.exp(torch.arange(0, d_model, 2).float() * (-math.log(10000.0) / d_model))
    pe[:, 0::2] = torch.sin(position * div_term)
    pe[:, 1::2] = torch.cos(position * div_term)
    pe = pe.unsqueeze(0).transpose(0, 1)
    self.register_buffer('pe', pe)

def forward(self, x):
    x = x + self.pe[:x.size(0), :]
    return self.dropout(x)

import io
import torch
from torchtext.utils import download_from_url, extract_archive
from torchtext.data.utils import get_tokenizer
from torchtext.vocab import build_vocab_from_iterator

url='https://s3.amazonaws.com/research.metamind.io/wikitext/wikitext-2-v1.zip'
test_filepath, valid_filepath, train_filepath = extract_archive(download_from_url(
    url))
tokenizer = get_tokenizer('basic_english')
vocab = build_vocab_from_iterator(map(tokenizer,
                                      iter(io.open(train_filepath,
                                                   encoding="utf8"))))

def data_process(raw_text_iter):
  data = [torch.tensor([vocab[token] for token in tokenizer(item)],
                       dtype=torch.long) for item in raw_text_iter]
  return torch.cat(tuple(filter(lambda t: t.numel() > 0, data)))

train_data = data_process(iter(io.open(train_filepath, encoding="utf8")))
val_data = data_process(iter(io.open(valid_filepath, encoding="utf8")))
test_data = data_process(iter(io.open(test_filepath, encoding="utf8")))

device = torch.device("cuda" if torch.cuda.is_available() else "cpu")

def batchify(data, bsz):
    # Divide the dataset into bsz parts.
    nbatch = data.size(0) // bsz
    # Trim off any extra elements that wouldn't cleanly fit (remainders).
    data = data.narrow(0, 0, nbatch * bsz)
    # Evenly divide the data across the bsz batches.
    data = data.view(bsz, -1).t().contiguous()
    return data.to(device)

batch_size = 20
eval_batch_size = 10
train_data = batchify(train_data, batch_size)
val_data = batchify(val_data, eval_batch_size)
test_data = batchify(test_data, eval_batch_size)
bptt = 35
def get_batch(source, i):
    seq_len = min(bptt, len(source) - 1 - i)
    data = source[i:i+seq_len]
    target = source[i+1:i+1+seq_len].reshape(-1)
    return data, target
ntokens = len(vocab.stoi) # the size of vocabulary
emsize = 200 # embedding dimension
nhid = 200 # the dimension of the feedforward network model in nn.TransformerEncoder
nlayers = 2 # the number of nn.TransformerEncoderLayer in nn.TransformerEncoder
nhead = 2 # the number of heads in the multiheadattention models
dropout = 0.2 # the dropout value
model = TransformerModel(ntokens, emsize, nhead, nhid, nlayers, dropout).to(device)
criterion = nn.CrossEntropyLoss()
lr = 5.0 # learning rate
optimizer = torch.optim.SGD(model.parameters(), lr=lr)
scheduler = torch.optim.lr_scheduler.StepLR(optimizer, 1.0, gamma=0.95)

import time
def train():
    model.train() # Turn on the train mode
    total_loss = 0.
    start_time = time.time()
    src_mask = model.generate_square_subsequent_mask(bptt).to(device)
    for batch, i in enumerate(range(0, train_data.size(0) - 1, bptt)):
        data, targets = get_batch(train_data, i)
        optimizer.zero_grad()
        if data.size(0) != bptt:
            src_mask = model.generate_square_subsequent_mask(data.size(0)).to(device)
        output = model(data, src_mask)
        loss = criterion(output.view(-1, ntokens), targets)
        loss.backward()
        torch.nn.utils.clip_grad_norm_(model.parameters(), 0.5)
        optimizer.step()

        total_loss += loss.item()
        log_interval = 200
        if batch % log_interval == 0 and batch > 0:
            cur_loss = total_loss / log_interval
            elapsed = time.time() - start_time
            print('| epoch {:3d} | {:5d}/{:5d} batches | '
                  'lr {:02.2f} | ms/batch {:5.2f} | '
                  'loss {:5.2f} | ppl {:8.2f}'.format(
                    epoch, batch, len(train_data) // bptt, scheduler.get_lr()[0],
                    elapsed * 1000 / log_interval,
                    cur_loss, math.exp(cur_loss)))
            total_loss = 0
            start_time = time.time()

def evaluate(eval_model, data_source):
    eval_model.eval() # Turn on the evaluation mode
    total_loss = 0.
    src_mask = model.generate_square_subsequent_mask(bptt).to(device)
    with torch.no_grad():
        for i in range(0, data_source.size(0) - 1, bptt):
            data, targets = get_batch(data_source, i)
            if data.size(0) != bptt:
                src_mask = model.generate_square_subsequent_mask(data.size(0)).to(device)
            output = eval_model(data, src_mask)
            output_flat = output.view(-1, ntokens)
            total_loss += len(data) * criterion(output_flat, targets).item()
    return total_loss / (len(data_source) - 1)
best_val_loss = float("inf")
epochs = 3 # The number of epochs
best_model = None

for epoch in range(1, epochs + 1):
    epoch_start_time = time.time()
    train()
    val_loss = evaluate(model, val_data)
    print('-' * 89)
    print('| end of epoch {:3d} | time: {:5.2f}s | valid loss {:5.2f} | '
          'valid ppl {:8.2f}'.format(epoch, (time.time() - epoch_start_time),
                                     val_loss, math.exp(val_loss)))
    print('-' * 89)

if val_loss < best_val_loss:
    best_val_loss = val_loss
    best_model = model

scheduler.step()

运行结果及报错内容

我的解答思路和尝试过的方法

我想要达到的结果

[]()

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

报告相同问题？

关注问题

PyTorch 怎么修改默认device？ pytorch 深度学习神经网络
2022-04-26 09:27

回答 2 已采纳没有方法，只能 device = device = torch.device('cuda',0) # 在后续的 torch.Tensor 和 torch.nn.Module 后添加 to(devic
pytorch数据集出现问题?? pytorch 人工智能
2021-07-16 17:15

回答 1 已采纳 [[1.0],[2.0],[3.0]],下面一样外面加层括号
pytorch的一个报错该如何解决？ pytorch transformer 图像处理
2023-03-03 16:34

回答 2 已采纳小魔女参考了bing和GPT部分内容调写:如果你使用的是pytorch1.5.1版本，那么你应该安装apex包的1.0.1版本。安装不对的话，可能会出现报错，比如模型训练时出现RuntimeError
Pytorch加载数据
2024-04-22 20:47

玛卡巴卡的巴卡马卡的博客 2、os.path.join函数的作用：将两个路径进行拼接，并根据系统环境进行选择使用正斜杠或反斜杠。...1、如何获取每一个数据及其label。2、告诉我们总共有多少个数据。3、导入Image主要是用于对图片进行操作。
pytorch中这个数值为什么不变呢？ pytorch
2022-09-17 23:58

回答 1 已采纳我猜测tensor.data返回的应该是数据的副本而不是视图，所以x不会改变。tensor之间的计算直接使用tensor本身就好了，不需要使用data属性。你可以把tensor看作是多维数组，可以直接
pytorch加载model发现key的值有差异，能不能修改 python 机器学习深度学习神经网络
2019-04-12 13:39

回答 1 已采纳解决了， torchload返回的是字典，搞一个新字典，然后把key用‘.’分段后重新组装一个字典就可以读了
pytorch 的dataloader使用一个epoch后需要重新“装载”么？ python pytorch 机器学习
2022-10-24 14:12

回答 2 已采纳你的数据很多吗？一般情况下是不需要的，DataLoader本身是个可迭代的东西，如果设计得当的话大部分情况是不需要多次加载的。
【PyTorch】加载数据集Dataset与DataLoader
2022-11-17 16:17

小橙子爱蜜蜂的博客关于PyTorch构建数据集的Dataset与DataLoader的一些记录笔记
用pytorch写了一个经典的鸢尾花分类 pytorch 分类机器学习
2022-10-25 10:18

回答 2 已采纳尝试把batch size调小，或者学习率调小点试试。
Pytorch机器学习在使用fashion-minist数据集是发生错误 python pytorch 有问必答机器学习
2021-07-04 11:08

回答 1 已采纳 np.array()只接收一个位置参数，而代码中有两个个，所以报错，numpy.array(object, dtype=None, copy=True, order='K', subok=False,
安装anaconda和pytorch后pycharm中无法正常加载相关库的问题 pycharm python pytorch
2022-05-29 20:22

回答 7 已采纳原因当你只是import 某个包（Python自带的或者第三方的），但是下面代码并没有使用这个包的时候，颜色是灰色的，提示你这个包目前没被使用。当你import 某个包（Python自带的或者第三
pytorch数据加载num_worker设置报错Broken pipe
2024-07-17 15:50

槑脑槑头的博客 pytorch设置dataloader时有一个重要的参数'num_worker',这个参数设置为0时一切正常，但是速度慢。当设置不为0时就会出现'RuntimeError: : [Errno 32] Broken pipe'报错。这个问题困扰了我好久，有时候设置不为0也不...
pytorch重写Dataset类，用于读取csv数据 python pytorch 有问必答深度学习
2022-02-23 16:19

回答 2 已采纳根据数据类型进行转换一下试试，类似这样： import numpy as np s='251 251 251 253 246 217 186 172 162 139 144 113 92 164 20
学习pytorch: 数据加载和处理
2020-04-13 17:57

此人姓于名叫罩百灵的博客结合官方tutorials和源码以及部分博客写出此文，主要介绍了Pytorch加载和处理数据的原理以及方法。
Pytorch加载MNIST数据集报错HTTP和Download的解决方法
2024-07-01 16:07

益生君丶的博客在网上下载mnist数据集报错download not found,原因在于数据集格式，初步排查是少了proceed数据集，我这边下载的mnist数据集没有proceed文件夹和pt文件，建议直接用torch下载的数据集格式加载，自己下载原始数据集...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 12月28日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 12月20日

悬赏问题

¥15 单纯型python实现编译报错
¥15 c++2013读写oracle
¥15 c++ gmssl sm2验签demo
¥15 关于模的完全剩余系(关键词-数学方法)
¥15 有没有人懂这个博图程序怎么写，还要跟SFB连接，真的不会，求帮助
¥15 PVE8.2.7无法成功使用a5000的vGPU，什么原因
¥15 keil官网下载psn序列号在哪
¥15 想用adb命令做一个通话软件，播放录音
¥30 Pytorch深度学习服务器跑不通问题解决？
¥15 部分客户订单定位有误的问题

pytorch数据加载，这个错误该怎么改

问题遇到的现象和发生背景

问题相关代码，请勿粘贴截图

运行结果及报错内容

我的解答思路和尝试过的方法

我想要达到的结果

0条回答 默认 最新

问题事件

悬赏问题

0条回答默认最新