QRNN网络运行：OSError: [WinError 126] 找不到指定的模块怀疑和pynvrtc库有关：self._load_nvrtc_lib(lib_path，如何解决？

运行Github上的QRNN网络（项目地址：https://github.com/salesforce/pytorch-qrnn: [WinError 126] 找不到指定的模块“错误。初步怀疑和pynvrtc库以及 GPUForgetMult类中定义的compile(self)函数有关。但代码调试经验实在太少，无法查出“指定模块”是什么...

框架pytorch

运行forget_mult.py文件：

import math
import torch
from torch.autograd import Variable
from cupy.cuda import function
import pynvrtc
from pynvrtc.compiler import Program
from collections import namedtuple

###

kernel = '''
extern "C"
__global__ void recurrent_forget_mult(float *dst, const float *f, const float *x, int SEQ, int BATCH, int HIDDEN)
{
  /*
  Note: destination is assumed to be one timestep longer than f or x where dst[0] = h_{-1}
  This means dst array has a separate index than that of f or x
  */
  int hid = blockIdx.x * blockDim.x + threadIdx.x;
  int bid = blockIdx.y * blockDim.y + threadIdx.y;
  if(hid >= HIDDEN || bid >= BATCH)
     return;
  //
  for (int ts = 0 + 1; ts < SEQ + 1; ts++) {
     // Good sanity check for debugging - only perform additions to a zeroed chunk of memory
     // Addition seems atomic or near atomic - you should get incorrect answers if doubling up via threads
     // Note: the index i needs to be offset by one as f[0] (f_t) is used for dst[1] (h_t) etc

     // To move timesteps, we step HIDDEN * BATCH
     // To move batches, we move HIDDEN
     // To move neurons, we move +- 1
     // Note: dst[dst_i] = ts * 100 + bid * 10 + hid; is useful for debugging

     int i           = (ts - 1) * HIDDEN * BATCH + bid * HIDDEN + hid;
     int dst_i       = (ts - 0) * HIDDEN * BATCH + bid * HIDDEN + hid;
     int dst_iminus1 = (ts - 1) * HIDDEN * BATCH + bid * HIDDEN + hid;
     dst[dst_i]      = f[i] * x[i];
     dst[dst_i]      += (1 - f[i]) * dst[dst_iminus1];
  }
}

extern "C"
__global__ void bwd_recurrent_forget_mult(const float *h, const float *f, const float *x, const float *gh, float *gf, float *gx, float *ghinit, int SEQ, int BATCH, int HIDDEN)
{
  /*
  Note: h is assumed to be one timestep longer than f, x, gf, gx, or gh where dst[0] = h_{-1}
  This means dst array has a separate index than that of f or x
  */
  int hid = blockIdx.x * blockDim.x + threadIdx.x;
  int bid = blockIdx.y * blockDim.y + threadIdx.y;
  if(hid >= HIDDEN || bid >= BATCH)
     return;
  //
  double running_f = 0;
  for (int ts = SEQ - 1 + 1; ts >= 0 + 1; ts--) {
     int i           = (ts - 1) * HIDDEN * BATCH + bid * HIDDEN + hid;
     int dst_i       = (ts - 0) * HIDDEN * BATCH + bid * HIDDEN + hid;
     int dst_iminus1 = (ts - 1) * HIDDEN * BATCH + bid * HIDDEN + hid;
     //
     running_f       += gh[dst_iminus1];
     // Gradient of X
     gx[i]           = f[i] * running_f;
     // Gradient of F
     gf[i]           = (x[i] - h[dst_iminus1]) * running_f;
     //
     // The line below is likely more numerically stable than (1 - f[i]) * running_f;
     running_f       = running_f - f[i] * running_f;
  }
  ghinit[bid * HIDDEN + hid] = running_f;
}
'''

###

class CPUForgetMult(torch.nn.Module):
    def __init__(self):
        super(CPUForgetMult, self).__init__()

    def forward(self, f, x, hidden_init=None):
        result = []
        ###
        forgets = f.split(1, dim=0)
        prev_h = hidden_init
        for i, h in enumerate((f * x).split(1, dim=0)):
            if prev_h is not None: h = h + (1 - forgets[i]) * prev_h
            # h is (1, batch, hidden) when it needs to be (batch_hidden)
            # Calling squeeze will result in badness if batch size is 1
            h = h.view(h.size()[1:])
            result.append(h)
            prev_h = h
        ###
        return torch.stack(result)


class GPUForgetMult(torch.autograd.Function):
    configured_gpus = {}
    ptx = None
    def __init__(self):
        super(GPUForgetMult, self).__init__()

    def compile(self):
        if self.ptx is None:
            program = Program(kernel.encode(), 'recurrent_forget_mult.cu'.encode())
            GPUForgetMult.ptx = program.compile()

        if torch.cuda.current_device() not in GPUForgetMult.configured_gpus:
            m = function.Module()
            m.load(bytes(self.ptx.encode()))

            self.forget_mult = m.get_function('recurrent_forget_mult')
            self.bwd_forget_mult = m.get_function('bwd_recurrent_forget_mult')

            Stream = namedtuple('Stream', ['ptr'])
            self.stream = Stream(ptr=torch.cuda.current_stream().cuda_stream)

            GPUForgetMult.configured_gpus[torch.cuda.current_device()] = (self.forget_mult, self.bwd_forget_mult, self.stream)

        self.forget_mult, self.bwd_forget_mult, self.stream = GPUForgetMult.configured_gpus[torch.cuda.current_device()]

    def forward(self, f, x, hidden_init=None):
        self.compile()
        seq_size, batch_size, hidden_size = f.size()
        result = f.new(seq_size + 1, batch_size, hidden_size)
        # We only zero the result array (result[0]) if we don't set a hidden initial state
        # All other values (result[1:]) are overwritten by default
        if hidden_init is not None: result[0, :, :] = hidden_init
        else: result = result.zero_()
        ###
        grid_hidden_size = min(hidden_size, 512)
        grid = (math.ceil(hidden_size / grid_hidden_size), batch_size)
        self.forget_mult(grid=grid, block=(grid_hidden_size, 1), args=[result.data_ptr(), f.data_ptr(), x.data_ptr(), seq_size, batch_size, hidden_size], stream=self.stream)
        self.save_for_backward(f, x, hidden_init)
        self.result = result
        return result[1:, :, :]

    def backward(self, grad_h):
        self.compile()
        f, x, hidden_init = self.saved_tensors
        h = self.result
        ###
        seq_size, batch_size, hidden_size = f.size()
        # Zeroing is not necessary as these will be overwritten
        grad_f = f.new(*f.size())
        grad_x = f.new(*f.size())
        grad_h_init = f.new(batch_size, hidden_size)
        ###
        grid_hidden_size = min(hidden_size, 512)
        grid = (math.ceil(hidden_size / grid_hidden_size), batch_size)
        self.bwd_forget_mult(grid=grid, block=(grid_hidden_size, 1), args=[h.data_ptr(), f.data_ptr(), x.data_ptr(), grad_h.data_ptr(), grad_f.data_ptr(), grad_x.data_ptr(), grad_h_init.data_ptr(), seq_size, batch_size, hidden_size], stream=self.stream)
        ###
        if hidden_init is not None:
            return grad_f, grad_x, grad_h_init
        return grad_f, grad_x


class ForgetMult(torch.nn.Module):
    r"""ForgetMult computes a simple recurrent equation:
    h_t = f_t * x_t + (1 - f_t) * h_{t-1}

    This equation is equivalent to dynamic weighted averaging.

    Inputs: X, hidden
        - X (seq_len, batch, input_size): tensor containing the features of the input sequence.
        - F (seq_len, batch, input_size): tensor containing the forget gate values, assumed in range [0, 1].
        - hidden_init (batch, input_size): tensor containing the initial hidden state for the recurrence (h_{t-1}).
        - use_cuda: If True, use the fast element-wise CUDA kernel for recurrence. If False, uses naive for loop. Default: True.
    """

    def __init__(self):
        super(ForgetMult, self).__init__()

    def forward(self, f, x, hidden_init=None, use_cuda=True):
        # Use CUDA by default unless it's available
        use_cuda = use_cuda and torch.cuda.is_available()
        # Ensure the user is aware when ForgetMult is not GPU version as it's far faster
        if use_cuda: assert f.is_cuda and x.is_cuda, 'GPU ForgetMult with fast element-wise CUDA kernel requested but tensors not on GPU'
        ###
        # Avoiding 'RuntimeError: expected a Variable argument, but got NoneType' when hidden_init is None
        if hidden_init is None: return GPUForgetMult()(f, x) if use_cuda else CPUForgetMult()(f, x)
        return GPUForgetMult()(f, x, hidden_init) if use_cuda else CPUForgetMult()(f, x, hidden_init)

###

if __name__ == '__main__':
    seq, batch, hidden = 35, 20, 650
    # Larger input (batch * seq * hidden) results in excessive memory for gradient check
    seq, batch, hidden = 3, 7, 19
    a      = Variable(torch.rand(seq, batch, hidden).cuda(), requires_grad=True)
    forget = Variable(torch.rand(seq, batch, hidden).cuda(), requires_grad=True)
    last_h = Variable(torch.rand(batch, hidden).cuda(), requires_grad=True)

    #seq, batch, hidden = 4, 1, 1
    #a = Variable(torch.Tensor([0.75, 0.5, 0.9, 0.8]).view(seq, batch, hidden).cuda(), requires_grad=True)
    #forget = Variable(torch.Tensor([0.25, 0.25, 0.5, 0.4]).view(seq, batch, hidden).cuda(), requires_grad=True)
    #last_h = Variable(torch.Tensor([0]).view(batch, hidden).cuda(), requires_grad=True)
    #print(forget, a, last_h)

    print('CUDA forget mult')
    print('=-=-' * 5)

    resulta = ForgetMult()(forget, a, last_h, use_cuda=True)
    print(resulta.size())
    loss = resulta.pow(2).sum()
    loss.backward()

    print('Result =', loss.data[0])
    print('X grad =', a.grad.mean().data[0])
    print('Forget grad =', forget.grad.mean().data[0])
    print('Last H grad =', last_h.grad.mean().data[0])

    x_grad_copy = a.grad.clone()

    print()
    print('CPU forget mult')
    print('=-=-' * 5)

    a.grad.data *= 0
    forget.grad.data *= 0
    last_h.grad.data *= 0

    resultb = ForgetMult()(forget, a, last_h, use_cuda=False)
    print(resultb.size())
    loss = resultb.pow(2).sum()
    loss.backward()

    print('Result =', loss.data[0])
    print('X grad =', a.grad.mean().data[0])
    print('Forget grad =', forget.grad.mean().data[0])
    print('Last H grad =', last_h.grad.mean().data[0])

    ###

    print()
    print('=-=-' * 5)
    print('(Xgrad - Xgrad).sum() =', (x_grad_copy - a.grad).sum().data[0])
    print('Residual error for result')
    print('=-=-' * 5)
    residual = (resulta - resultb)
    print(residual.abs().sum().data[0])
 
    # Had to loosen gradient checking, potentially due to general floating point badness?
    from torch.autograd import gradcheck
    inputs = [forget, a, last_h]
    test = gradcheck(ForgetMult(), inputs, eps=1e-4, atol=1e-2)
    print(test)

报错为：

D:\Anaconda3\envs\XXX\python.exe "C:/XXX/pytorch-qrnn-master/torchqrnn/forget_mult.py"
CUDA forget mult
=-=-=-=-=-=-=-=-=-=-
Warning: Legacy autograd function with non-static forward method is deprecated and will be removed in 1.3. Please use new-style autograd function with static forward method. (Example: https://pytorch.org/docs/stable/autograd.html#torch.autograd.Function) (THPFunction_do_forward at ..\torch\csrc\autograd\python_function.cpp:622)
Traceback (most recent call last):
  File "C:/XXX/pytorch-qrnn-master/torchqrnn/forget_mult.py", line 201, in <module>
    resulta = ForgetMult()(forget, a, last_h, use_cuda=True)
  File "D:\Anaconda3\envs\XXX\lib\site-packages\torch\nn\modules\module.py", line 532, in __call__
    result = self.forward(*input, **kwargs)
  File "C:/XXX/pytorch-qrnn-master/torchqrnn/forget_mult.py", line 180, in forward
    return GPUForgetMult()(f, x, hidden_init) if use_cuda else CPUForgetMult()(f, x, hidden_init)
  File "C:/XXX/pytorch-qrnn-master/torchqrnn/forget_mult.py", line 121, in forward
    self.compile()
  File "C:/XXX/pytorch-qrnn-master/torchqrnn/forget_mult.py", line 103, in compile
    program = Program(kernel.encode(), 'recurrent_forget_mult.cu'.encode())
  File "D:\Anaconda3\envs\XXX\lib\site-packages\pynvrtc\compiler.py", line 49, in __init__
    self._interface = NVRTCInterface(lib_name)
  File "D:\Anaconda3\envs\XXX\lib\site-packages\pynvrtc\interface.py", line 87, in __init__
    self._load_nvrtc_lib(lib_path)
  File "D:\Anaconda3\envs\XXX\lib\site-packages\pynvrtc\interface.py", line 109, in _load_nvrtc_lib
    self._lib = cdll.LoadLibrary(name)
  File "D:\Anaconda3\envs\XXX\lib\ctypes\__init__.py", line 426, in LoadLibrary
    return self._dlltype(name)
  File "D:\Anaconda3\envs\XXX\lib\ctypes\__init__.py", line 348, in __init__
    self._handle = _dlopen(self._name, mode)
OSError: [WinError 126] 找不到指定的模块。

从网上看了好多，说是缺少dll文件，已经把VS C++的库全部重新装了一遍，还是这个问题。希望有类似经历的伙伴给些建议。

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
CSDN专家-深度学习进阶 2022-02-27 09:44
关注
安装Shapely再运行试试

conda install -c conda-forge shapely

可以参考下这篇文章，希望对你有帮助：
self._handle = _dlopen(self._name, mode) OSError: [WinError 126] 找不到指定的模块_Good@dz的博客-CSDN博客
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

【[QRNN搭建][pynvrtc库] 记录解决“OSError: [WinError 126] 找不到指定的模块”问题】
2022-02-27 20:36

yogurt_lover的博客 [QRNN][pynvrtc]记录解决“OSError: [WinError 126] 找不到指定的模块”问题。主要包含3大问题：一、非静态方法的forward不再支持问题；二、[WinError 126] 找不到指定的模块问题；三、'bytes' object has no ...
tensorflow_qrnn：TensorFlow的QRNN实现
2021-02-06 05:13

Tensorflow QRNN TensorFlow的QRNN实现。实现参考下面的博客。依存关系 TensorFlow：0.12.0 scikit-learn：0.18.1（用于工作检查）怎么跑向前测试要确认正向传播，请运行以下脚本。 python test_tf_qrnn_...
张量网络编程学习笔记（4-1）：QRNN原理入门，QRNN_predic_time_series 的简介
2023-07-23 15:15

Sauvignon.的博客（1）前文提到的ADQC ~ FCNN：一种量子意义上的前馈层（2）循环结构QRNN = ADQC + 循环迭代：一种量子意义上的时序预测组合。
hsimatlab代码-QRNN3D:用于高光谱图像去噪的3D拟递归神经网络（TNNLS2020）
2021-05-25 09:07

matlab代码QRNN3D TNNLS 2020论文的实施强调我们的网络在高斯和复杂噪声情况下均优于ICVL数据集上的所有领先方法（2019），如下所示：我们证明了在31频段自然HSI数据库（ICVL）上进行预训练的网络可用于恢复由于...
QRNN-CloudCorrection:机器学习能否针对云的影响正确设置微波湿度辐射？
2021-04-10 04:34

使用QRNN消除微波通道中的云影响该存储库包含用于研究的代码，该研究的重点是微波湿度通道的云校正。这项研究发表为“机器学习能否针对云的影响正确校正微波湿度辐射？” 在AMT中。依存关系为了运行ARTS仿真和检索...
Deep_Learning:COSE474（2020-2）
2021-04-16 13:56

深度学习是一种人工智能领域的核心技术，它基于神经网络模型对复杂数据进行建模，尤其在图像识别、自然语言处理、语音识别等领域表现出卓越的性能。在"COSE474（2020-2）"这门课程中，学生将深入探讨深度学习的基本...
张量网络编程学习笔记（3-1）：TN_Tutorial神经网络模块化编程：AD_Circuits.FCNN.py - 一个简明完整的 FCNN 示例
2023-07-18 17:56

Sauvignon.的博客再QRNN（量子RNN），ADQC，LSTM，LSTM三者对比还会有个LSTM的封装， RNN，LSTM，这些或许还会作为我们的课程的笔记补充吧（）* 后文NN_alog.py 的 FC2_classifier，一个打包好的分类器，还有ADQC_classifier，这些...
keras调用load_model时报错ValueError: Unknown Layer
2022-03-08 16:37

无敌右脑的博客 keras调用load_model时报错ValueError: Unknown Layer
实验4-示例代码_RNN_源码.zip
2021-09-30 18:17

在本资源包“实验4-示例代码_RNN_源码.zip”中，包含的是关于循环神经网络（Recurrent Neural Network, RNN）的实践代码。RNN是一种深度学习模型，特别适合处理序列数据，如自然语言、时间序列数据等。这种网络结构...
regn:使用神经网络对全球降水进行稳健估计
2021-04-20 00:17

使用神经网络（REGN）可靠地估算全球降水首字母缩略词REGN代表使用神经网络对全球降水进行稳健估计。同时，瑞格（[rɛŋn]）是瑞典语中的雨。 REGN项目的目的是开发基于神经网络的GPROF算法实现。该存储库用于...
LSTM的加速算法：QRNN和SRU
2019-09-22 21:15

SYSU_BOND的博客对LSTM还不熟悉的同学可以先阅读：理解LSTM网络或者直接阅读Christopher Olah 的原博文：Understanding LSTM Networks 从上述公式中，我们先来分析公式中各个部分的计算复杂度，记和的大小为，则大小也是，W的...
low_resource_lm
2021-03-18 21:03

包括用于运行每个模型的必要命令行参数，以及用于下载和预处理训练数据的实用程序以及如何安装依赖项的说明。 LSTM 其中包括来自Google Colab的iPython笔记本的副本，可以方便地运行项目代码。用法示例：确保所有...
Python数据分析案例37——基于分位数神经网络(QRNN)的汇率预测
2024-01-19 12:09

阡之尘埃的博客使用分位数神经网络(QRNN)进行汇率的概率密度预测，并且和线性回归，分位数回归，普通神经网络进行对比。
探索更快更准确的文本理解：TensorFlow QRNN
2024-05-27 10:04

滑辰煦Marc的博客探索更快更准确的文本理解：TensorFlow QRNN tensorflow_qrnnQRNN implementation for TensorFlow项目地址:https://gitcode.com/gh_mirrors/te/tensorflow_qrnn 在这个快速发展的AI时代，我们始终在寻找能提升模型...
论文笔记22：QRNN3D: 3D Quasi-Recurrent Neural Network for Hyperspectral Image Denoising
2020-11-23 17:03

love_lqz的博客本文提出了一种用于高光谱图像去噪的交替方向三维准递归神经网络，该网络能够有效地嵌入领域知识——结构空间-光谱相关性和沿光谱的全局相关性。具体来说，3D卷积被用来提取HSI中的结构空间-光谱相关性，而准递归...
基于神经网络分位数回归的VaR金融风险测度.pdf
2021-09-27 21:01

神经网络分位数回归（Quantile Regression Neural Network，QRNN）是一种基于神经网络的分位数回归方法，通过将神经网络与分位数回归结合，解决了传统VaR风险测度方法中的两个难题：尾部风险测度和非线性关联模式。...
Transformers是SSMs：通过结构化状态空间对偶性的广义模型和高效算法(二)
2024-06-23 08:56

AI浩的博客联想记忆9.2、语言建模9.2.1、缩放定律9.2.3、混合模型：将SSD层与MLP和注意力层结合9.3、速度基准测试9.4、架构消融实验9.4.1、块设计9.4.3 注意力核近似10、相关工作和讨论10.1、状态空间模型10
证券投资基金收益概率密度预测——基于神经网络分位数回归模型.pdf
2021-09-27 20:59

White在1992年首次提出使用神经网络来估计条件分位数，随后Taylor的神经网络分位数回归(QRNN)模型和Cannon的详细计算方法进一步推动了该领域的研究。本文特别提到，神经网络分位数回归模型在电力负荷预测中的成功...
pytorch-pQRNN:PQRNN在PyTorch中的实现
2021-05-16 19:45

由于， pytorch-qrnn不再与pytorch兼容，并且也没有得到积极维护。如果要在此模型中使用QRNN层，请先安装torch <= 1.4 pytorch-qrnn 。用法 from pytorch_pqrnn . dataset import create_dataloaders from ...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已结题（查看结题原因） 2月27日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 2月26日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 2月26日

悬赏问题

¥50 同步两个不同结果的array中某些属性
¥15 悬赏15远程操控解决问题
¥15 CST复制的模型无法单独修改参数？
¥15 矩阵保留小数后答案里的0未显示
¥15 前端页面想做个定时任务，但是使用requestAnimationFrame，setinterval和settimeout都不行
¥15 根据以下文字信息，做EA模型图
¥15 删除虚拟显示器驱动删除所有 Xorg 配置文件删除显示器缓存文件重启系统可是依旧无法退出虚拟显示器
¥15 vscode程序一直报同样的错，如何解决?
¥15 关于使用unity中遇到的问题
¥15 开放世界如何写线性关卡的用例(类似原神）

QRNN网络运行：OSError: [WinError 126] 找不到指定的模块 怀疑和pynvrtc库有关：self._load_nvrtc_lib(lib_path，如何解决？

框架pytorch

运行forget_mult.py文件：

报错为：

1条回答 默认 最新

问题事件

悬赏问题

QRNN网络运行：OSError: [WinError 126] 找不到指定的模块怀疑和pynvrtc库有关：self._load_nvrtc_lib(lib_path，如何解决？

1条回答默认最新