深度学习循环神经网络提问

以下是我的代码，想问一下为什么会运行后会出现RuntimeError: expected scalar type Double but found Float的错误呢？该如何修改呢？

import time
import math
import zipfile

import numpy as np
import torch
from torch import nn,optim
import torch.nn.functional as F

import sys
sys.path.append("C:/Users/zyx20/Desktop/深度学习编程/pythonProject")
import d2lzh_pytorch as d2l
device=torch.device('cuda' if torch.cuda.is_available() else 'cpu')

with zipfile.ZipFile('C:/Users/zyx20/Desktop/深度学习编程/data20201205-master/Data20201205/jaychou_lyrics.txt.zip') as zin:
    with zin.open('jaychou_lyrics.txt') as f:
        corpus_chars=f.read().decode('utf-8')
corpus_chars=corpus_chars.replace('\n','').replace('\r','')
idx_to_char=list(set(corpus_chars))
char_to_idx=dict([(char,i) for i,char in enumerate(idx_to_char)])
vocab_size=len(char_to_idx)
corpus_indices=[char_to_idx[char] for char in corpus_chars]

def one_hot(x,n_class,dtype=torch.float32):
    x=x.long()
    res=torch.zeros(x.shape[0],n_class,dtype=dtype,device=x.device)
    res.scatter_(1,x.view(-1,1),1)
    return res

x=torch.tensor([0,2])
one_hot(x,vocab_size)

def to_oneshot(x,n_class):
    return [one_hot(x[:,i],n_class) for i in range(x.shape[1])]

num_inputs,num_hiddens,num_outputs=vocab_size,256,vocab_size

def get_params():
    def _one(shape):
        ts=torch.tensor(np.random.normal(0,0.1,size=shape),device=device,dtype=torch.float32)
        return torch.nn.Parameter(ts,requires_grad=True)
    #隐藏层参数
    w_xh=_one((num_inputs,num_hiddens))
    w_hh = _one((num_hiddens, num_hiddens))
    b_h=torch.nn.Parameter(torch.zeros(num_hiddens,device=device,requires_grad=True))
    #输出层参数
    w_hq=_one((num_hiddens,num_outputs))
    b_q=torch.nn.Parameter(torch.zeros(num_outputs,device=device,requires_grad=True))
    return nn.ParameterList([w_xh,w_hh,b_h,w_hq,b_q])
#返回初始化隐藏状态
def init_rnn_state(batch_size,bum_hiddens,device):
    return (torch.zeros(batch_size,num_hiddens).to(device),)
#定义在一个时间步里如何计算隐藏状态和输出,RNN函数
def rnn(inputs,state,params):
    w_xh, w_hh, b_h, w_hq, b_q=params
    h,=state
    outputs=[]
    for x in inputs:
        h=torch.tanh(torch.matmul(x,w_xh)+torch.matmul(h,w_hh)+b_h)
        y=torch.matmul(h,w_hq)+b_q
        outputs.append(y)
    return outputs,(h,)
#定义预测函数
def predict_rnn(prefix,num_chars,rnn,params,init_rnn_state,num_hiddens,vocab_size,device,idx_to_char,char_to_idx):
    state=init_rnn_state(1,num_hiddens,device)
    output=[char_to_idx[prefix[0]]]
    for t in range(num_chars+len(prefix)-1):
        x=to_oneshot(torch.tensor([[output[-1]]],device=device),vocab_size)
        (y,state)=rnn(x,state,params)
        if t<len(prefix)-1:
            output.append(char_to_idx[prefix[t+1]])
        else:
            output.append(int(y[0].argmax(dim=1).item()))
    return ''.join([idx_to_char[i] for i in output])
#裁剪梯度
def grad_clipping(params,theta,device):
    norm=torch.tensor([0.0],device=device)
    for param in params:
        norm+=(param.grad.data**2).sum()
    norm=norm.sqrt().item()
    if norm>theta:
        for param in params:
            param.grad.data *=(theta/norm)
#定义模型训练函数
def train_and_predict_rnn(rnn,get_params,init_rnn_state,num_hiddens,vocab_size,device,corpus_indices,
                          idx_to_char,char_to_idx,is_random_iter,num_epochs,num_steps,lr,clipping_theta,
                          batch_size,pred_period,pred_len,prefixes):
    if is_random_iter:
        data_iter_fn=d2l.data_iter_random
    else:
        data_iter_fn =d2l.data_iter_consecutive
    params=get_params()
    loss=nn.CrossEntropyLoss()

    for epoch in range(num_epochs):
        if not is_random_iter:
            state=init_rnn_state(batch_size,num_hiddens,device)
        l_sum,n,start=0.0,0,time.time()
        data_iter=data_iter_fn(corpus_indices,batch_size,num_steps,device)
        for x,y in data_iter:
            if is_random_iter:
                state=init_rnn_state(batch_size,num_hiddens,device)
            else:
                for s in state:
                    s.detach_()

            inputs=to_oneshot(x,vocab_size)
            (output,state)=rnn(inputs,state,params)
            outputs=torch.cat(outputs,dim=0)
            y=torch.transpose(y,0,1).contiguous().view(-1)
            l=loss(outputs,y.long())

            #梯度清零
            if params[0].grad is not None:
                for param in params:
                    param.grad.data_zero()
            l.backward()
            grad_clipping(params,clipping_theta,device)
            d2l.sgd(params,lr,1)
            l_sum+=l.item()*y.shape[0]
            n+=y.shape[0]

        if (epoch+1)%pred_period==0:
            print('epoch %d,perplexity %f,time %.2f sec'%(epoch+1,math.exp(l_sum/n),time.time()-start))
            for prefix in prefixes:
                print(' -',predict_rnn(prefix,pred_len,rnn,params,init_rnn_state,num_hiddens,vocab_size,device,idx_to_char,char_to_idx))

num_epochs,num_steps,batch_size,lr,clipping_theta=250,35,32,1e2,1e2-1
pred_period,pred_len,prefixes=50,50,['分开','不分开']
train_and_predict_rnn(rnn,get_params,init_rnn_state,num_hiddens,vocab_size,device,corpus_indices,
                          idx_to_char,char_to_idx,True,num_epochs,num_steps,lr,clipping_theta,
                          batch_size,pred_period,pred_len,prefixes)

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

4条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
百锦再@新空间代码工作室全栈领域优质创作者 2024-03-08 11:44
关注
在PyTorch中，RuntimeError: expected scalar type Double but found Float的错误通常是因为数据类型不匹配导致的。在您的代码中，可能是因为在将数据传递到模型中时数据类型不匹配导致的。
您可以尝试在将数据传递给模型之前将数据类型转换为正确的类型。例如，在以下代码片段中：
def one_hot(x, n_class, dtype=torch.float32):x = x.long()res = torch.zeros(x.shape[0], n_class, dtype=dtype, device=x.device)res.scatter_(1, x.view(-1, 1), 1)return res x = torch.tensor([0, 2])one_hot(x, vocab_size)
可以尝试将数据类型转换为正确的类型，例如将dtype=torch.float32更改为dtype=torch.float64，或者确保模型接收的数据类型与模型参数的数据类型匹配。
另外，您还可以在模型定义部分中检查数据类型是否匹配，确保模型参数和输入数据的数据类型一致。
通过这些调整，您可以避免RuntimeError: expected scalar type Double but found Float的错误。希望对您有帮助！如果您需要进一步的帮助，请告诉我。

有问题你别着急，评论留言都可以，看到马上就回复，尽量及时补充齐
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(3条)

报告相同问题？

关注问题

深度学习卷积神经网络 深度学习神经网络
2021-05-29 01:48

回答 2 已采纳 {{2,3,4},{3,4,5},{4,5,6}}
深度学习为什么需要图神经网络？深度学习神经网络
2022-10-21 11:36

回答 1 已采纳随着机器学习、深度学习的发展，语音、图像、自然语言处理逐渐取得了很大的突破，然而语音、图像、文本都是很简单的序列或者网格数据，是很结构化的数据，深度学习很善于处理该种类型的数据。然而现实世界中并不是所
现在神经网络与深度学习的发展怎么样深度学习神经网络
2022-10-18 17:01

回答 1 已采纳很火热
python神经网络编程代码,python神经网络编程豆瓣
2022-08-20 14:44

「已注销」的博客阶段二：Python高级编程和数据库开发Python全栈开发与人工智能之Python高级编程和数据库开发知识学习内容包括：面向对象开发、Socket网络编程、线程、进程、队列、IO多路模型、Mysql数据库开发等。
基于python做神经网络、深度学习需不需要自己写代码，需要写到什么程度呢？ python 有问必答深度学习神经网络
2022-05-16 13:12

回答 6 已采纳的确是很多第三方库给你去用，直接import就可以，但是问题是，如果目前出了问题，第三方库无法满足你的需求，你需要进一步修改代码你怎么办？而且这个问题在实际应用中是经常碰见的，这时候你会不会神经网络基
关于深度学习的网络前沿 python 深度学习神经网络
2023-03-09 22:39

回答 3 已采纳该回答引用ChatGPT 在医学图像分割领域，目前最先进的语义分割神经网络包括： U-Net：U-Net是一种全卷积网络，用于医学图像分割，它在2015年被提出。它的网络结构包含了一个下采样路径和
【深度学习】如何绘制网络模型图深度学习神经网络
2023-03-20 15:19

回答 2 已采纳请看👉 ：如何绘制深度学习模型图？
ChatGPT：深度学习和机器学习的知识桥梁
2023-09-06 14:11

艾派森的博客 ChatGPT，即“Chat Generative Pre-trained Transformer”，是一种基于深度学习的自然语言处理模型，由OpenAI开发。这个模型的独特之处在于它的能力，可以生成自然、流畅的文本，仿佛是来自一个有思维的聊天伙伴。...
深度学习模型:训练出来的F1值比准确率高，写正常吗深度学习神经网络自然语言处理
2023-04-03 17:11

回答 2 已采纳准确率和F1值都是常用的模型性能指标，通常用于评估分类问题的性能。准确率是正确分类的样本数与总样本数之比，而F1值是模型预测精度和召回率的加权平均值。F1值的计算方式将模型的准确率和召回率同时考虑，因
深度学习LSTM的参数问题 lstm 深度学习神经网络
2023-03-07 11:00

回答 4 已采纳参考GPT和自己的思路，LSTM的参数W、U、b可以通过随机初始化或者预训练的方式获得。一般来说，W、U、b的维度和对应的输入和输出维度相关。在你给出的LSTM结构中，输入xt的大小是100，ht的
使用深度学习对于楼梯尺寸进行检测图像处理深度学习神经网络
2022-12-07 20:33

回答 2 已采纳下面为使用 TensorFlow 2 实现深度学习来处理楼梯图像的示例代码： import tensorflow as tf # 定义输入和输出数据的占位符 # 输入数据包括楼梯图像和深度图像 in
深度学习吴恩达老师（一）：神经网络和深度学习(Neural Networks and Deep Learning)：内容整理 + 习题分享
2021-11-16 17:03

是Dream呀的博客 神经网络和深度学习Neural Networks and Deep Learning：1.1 欢迎(Welcome)1.2 什么是神经网络？(What is a Neural Network)1.3 神经网络的监督学习(Supervised Learning with Neural Networks)1.4 为什么深度学习会...
tensorflow2.x 深度学习 使用相同梯度进行梯度下降的两个相同神经网络，得到的结果却不同 tensorflow 深度学习神经网络
2021-03-12 00:07

回答 2 已采纳在上面给的代码的第164行处插入 optimizer = optimizers.Adam(lr=1e-4) 重新初始化optimizer，这样两个模型训练后的测试结果就一样了，望采纳
自然语言处理中的前馈神经网络
2024-06-22 09:31

lzx618的博客自然语言处理（NLP）作为人工智能领域的...随着深度学习技术的兴起，前馈神经网络（Feedforward Neural Networks，FNN）在自然语言处理中发挥着越来越重要的作用。本文旨在介绍前馈神经网络的基本原理和在NLP中的应用。
多层感知器神经网络模型,人工智能神经网络模型
2022-08-17 12:32

阳阳2013哈哈的博客一种是循环神经网络(RecurrentNeuralNetwork);另一种是结构递归神经网络(RecursiveNeuralNetwork)，它使用相似的网络结构递归形成更加复杂的深度网络。RNN它们都可以处理有序列的问题，比如时间序列等且RNN有“记忆...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 3月16日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 3月8日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 3月8日

悬赏问题

¥15 vscode编译ros找不到头文件，cmake.list文件出问题，如何解决？(语言-c++|操作系统-linux)
¥15 通过AT指令控制esp8266发送信息
¥15 有哪些AI工具提供可以通过代码上传EXCEL文件的API接口，并反馈分析结果
¥15 二维装箱算法、矩形排列算法（相关搜索：二维装箱）
¥20 nrf2401上电之后执行特定任务概率性一直处于最大重发状态
¥15 二分图中俩集合中节点数与连边概率的关系
¥20 wordpress如何限制ip访问频率
¥15 自研小游戏，需要后台服务器存储用户数据关卡配置等数据
¥15 请求解答odoo17外发加工某工序的实操方法
¥20 IDEA ssm项目跳转页面报错500

深度学习循环神经网络提问

4条回答 默认 最新

问题事件

悬赏问题

4条回答默认最新