和鲸社区的GPU环境出现报错

报错场景：
运行torch1.8.0

报错内容：


Args in experiment:
Namespace(activation='gelu', attn='prob', batch_size=32, c_out=1, checkpoints='./checkpoints/', cols=None, d_ff=2048, d_layers=1, d_model=512, data='chicken', data_path='月均价.csv', dec_in=1, des='test', detail_freq='m', devices='0,1,2,3', distil=True, do_predict=True, dropout=0.1, e_layers=2, embed='timeF', enc_in=1, factor=5, features='S', freq='m', gpu=0, inverse=True, itr=100, label_len=6, learning_rate=0.0001, loss='mse', lradj='type1', mix=True, model='informer', n_heads=8, num_workers=0, output='./output', output_attention=False, padding=0, patience=5, pred_len=1, random_choos=True, root_path='./data/chicken/', s_layers=[3, 2, 1], seed=12345, seq_len=12, target='price', train_epochs=100, use_amp=False, use_gpu=True, use_multi_gpu=False)
提示：由于未来还没有发生，在真实值数据中没有这个月份数据，故而无法画出未来预测值~未来值的对比图!
Program to continue！>>>
Use GPU: cuda:0
>>>>>>>start training :  informer_chicken_ftS_sl12_ll6_pl1_dm512_nh8_el2_dl1_df2048_atprob_fc5_ebtimeF_dtTrue_mxTrue_test_0  >>>>>>>>>>>>>>>>>>>>>>>>>>
train 104
val 18
test 33
Traceback (most recent call last):
  File "main_informer.py", line 289, in <module>
    model,info_dict,all_epoch_train_loss,all_epoch_vali_loss,all_epoch_test_loss,epoch_count = exp.train(setting,info_dict,run_name_dir_ckp,run_ex_dir)
  File "/home/mw/project/exp/exp_informer.py", line 240, in train
    pred, true = self._process_one_batch(train_data, batch_x, batch_y, batch_x_mark, batch_y_mark)
  File "/home/mw/project/exp/exp_informer.py", line 498, in _process_one_batch
    outputs = self.model(batch_x, batch_x_mark, dec_inp, batch_y_mark)
  File "/opt/conda/lib/python3.8/site-packages/torch/nn/modules/module.py", line 889, in _call_impl
    result = self.forward(*input, **kwargs)
  File "/home/mw/project/models/model.py", line 69, in forward
    enc_out = self.enc_embedding(x_enc, x_mark_enc)
  File "/opt/conda/lib/python3.8/site-packages/torch/nn/modules/module.py", line 889, in _call_impl
    result = self.forward(*input, **kwargs)
  File "/home/mw/project/models/embed.py", line 107, in forward
    x = self.value_embedding(x) + self.position_embedding(x) + self.temporal_embedding(x_mark)
  File "/opt/conda/lib/python3.8/site-packages/torch/nn/modules/module.py", line 889, in _call_impl
    result = self.forward(*input, **kwargs)
  File "/home/mw/project/models/embed.py", line 37, in forward
    x = self.tokenConv(x.permute(0, 2, 1)).transpose(1,2)
  File "/opt/conda/lib/python3.8/site-packages/torch/nn/modules/module.py", line 889, in _call_impl
    result = self.forward(*input, **kwargs)
  File "/opt/conda/lib/python3.8/site-packages/torch/nn/modules/conv.py", line 263, in forward
    return self._conv_forward(input, self.weight, self.bias)
  File "/opt/conda/lib/python3.8/site-packages/torch/nn/modules/conv.py", line 256, in _conv_forward
    return F.conv1d(F.pad(input, self._reversed_padding_repeated_twice, mode=self.padding_mode),
RuntimeError: cuDNN error: CUDNN_STATUS_NOT_INITIALIZED

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

报告相同问题？

关注问题

【AI】GPU编译器入门
2025-11-27 17:46

Juice_Synopsys的博客 LLVM 现在是一个总称，指的是一个庞大的、可重用的编译器和工具链技术的集合。前端 (Frontend) ：将各种高级语言（如 C++, Rust, Swift 等）编译成统一的 LLVM 中间表示 (IR)。最著名的 LLVM 前端是 Clang ，用于...
一篇文章学会大模型【魔搭社区教程】【本地部署通义Qwen2大模型：配置+微调+部署，带你训练自己的行业大模型！】【源代码】【已经解决天坑】【程序员猫爪】
2024-12-25 21:43

MocCard的博客一篇文章学会大模型【魔搭社区教程】【程序员猫爪】【本地部署通义Qwen2大模型：配置+微调+部署，带你训练自己的行业大模型！】【已经解决天坑】
ai大赛gogogo
2022-04-16 17:26

AKA老实人的博客第一节：AI大赛信息介绍关联分析：啤酒尿布属于推荐系统连接分析：影响力排序算法谷爱凌机器学习包：sklearn CGB catboost paddle 提供v100 gpu 启发式算法：运筹学服务调度 operation...
Fun-ASR vs Qwen3-ASR vs Dolphin实测对比：云端GPU 2小时搞定选型
2026-01-17 03:18

EmeraldWolf23的博客本文介绍了如何在星图GPU平台自动化部署Fun-ASR-MLT-Nano-2512语音识别模型二次开发构建by113...基于该镜像，用户可在智能客服场景中高效完成方言识别、热词优化等AI应用开发，无需复杂环境配置，显著降低验证成本。
避坑指南：DGL安装常见问题及解决方案（附版本选择建议）
2025-09-07 11:03

深海孤鲸134的博客本文提供了一份详尽的DGL安装避坑指南，针对图神经网络环境搭建中常见的CUDA版本不匹配、PyTorch依赖冲突等问题，给出了从环境准备、版本选择到实战排查的完整解决方案。文章特别强调了使用Conda管理环境、正确选择...
Stable-Diffusion-v1-5-archive教育行业落地：中小学美育课程AI绘图实践案例
2026-01-26 03:59

叶深深的博客本文介绍了如何在星图GPU平台上自动化部署stable-diffusion-...该平台简化了AI绘图环境的搭建，使师生能快速利用该工具进行图片生成，例如在语文课堂上将古诗意境转化为视觉画面，有效激发学生创意并降低艺术创作门槛。
neural_gcm模型进行气象预测教程
2025-02-15 18:07

叫我锐多宝的博客 NeuralGCM （General circulation models）是Google开发的一种新型的天气和气候模型，它结合了传统的物理建模与机器学习技术，相关论文于2024年发表在nature上。它既可以做短期的天气预报，也可以做长期的气候预测。...
Transformer的手动实现讲解（超详细解释与代码注释）
2025-03-17 21:16

LL-2001的博客 3️⃣ 通过划分到h个头，增强特征表达鲁棒性，并行计算提升训练速度，支持大规模GPU加速。 4.Encoder 4.1 Add&Norm 针对Multi-Head Attention的Add&Norm： L a y e r N o r m ( X + M u l t i H e a d A t t e n t ...
AI绘画 stable diffusion Midjourney 官方GPT文档 AIGC百科全书资料收集
2023-08-17 15:12

KK_crazy的博客教学AI绘画 AIGC工具 SD教程。
保姆级教程：用ModelScope训练你的第一个远场语音唤醒模型（附FSMN实战代码）
2025-08-22 04:42

深海孤鲸134的博客文章详细介绍了从环境搭建、数据准备到使用FSMN模型进行两阶段训练的全流程，并提供了实战代码。教程重点讲解了如何应对远场环境下的噪声、混响等挑战，帮助开发者快速构建并部署首个可用的唤醒模型。
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 11月21日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 11月13日

和鲸社区的GPU环境出现报错

0条回答 默认 最新

问题事件

0条回答默认最新