torch问题-（stable diffusion2.0）

在debian11上执行python，关于torch的报错：

Python 3.10.8 (main, Nov 24 2022, 14:13:03) [GCC 11.2.0] on linux
Type "help", "copyright", "credits" or "license" for more information.
>>> import torch
>>> torch.cuda.is_available()
/root/miniconda3/envs/sd_GPU/lib/python3.10/site-packages/torch/cuda/__init__.py:83: UserWarning: HIP initialization: Unexpected error from hipGetDeviceCount(). Did you run some cuda functions before calling NumHipDevices() that might have already set an error? Error 101: hipErrorInvalidDevice (Triggered internally at  ../c10/hip/HIPFunctions.cpp:110.)
  return torch._C._cuda_getDeviceCount() > 0
False
>>>

运行stable diffusion 2.0的时候也是出现了这个错误。

(sd_GPU) root@debian:/home/LYF/stablediffusion/stablediffusion-main# python scripts/txt2img.py --prompt "a professional photograph of an astronaut riding a horse" --ckpt models/ldm/sd_v2/768model.ckpt --config configs/stable-diffusion/v2-inference-v.yaml --H 768 --W 768  
/root/miniconda3/envs/sd_GPU/lib/python3.10/site-packages/torchvision/io/image.py:13: UserWarning: Failed to load image Python extension: /root/miniconda3/envs/sd_GPU/lib/python3.10/site-packages/torchvision/image.so: undefined symbol: _ZN5torch3jit17parseSchemaOrNameERKNSt7__cxx1112basic_stringIcSt11char_traitsIcESaIcEEE
  warn(f"Failed to load image Python extension: {e}")
Global seed set to 42
Loading model from models/ldm/sd_v2/768model.ckpt
Global Step: 110000
No module 'xformers'. Proceeding without it.
LatentDiffusion: Running in v-prediction mode
DiffusionWrapper has 865.91 M params.
making attention of type 'vanilla' with 512 in_channels
Working with z of shape (1, 4, 32, 32) = 4096 dimensions.
making attention of type 'vanilla' with 512 in_channels
Traceback (most recent call last):
  File "/home/LYF/stablediffusion/stablediffusion-main/scripts/txt2img.py", line 289, in <module>
    main(opt)
  File "/home/LYF/stablediffusion/stablediffusion-main/scripts/txt2img.py", line 190, in main
    model = load_model_from_config(config, f"{opt.ckpt}")
  File "/home/LYF/stablediffusion/stablediffusion-main/scripts/txt2img.py", line 43, in load_model_from_config
    model.cuda()
  File "/root/miniconda3/envs/sd_GPU/lib/python3.10/site-packages/pytorch_lightning/core/mixins/device_dtype_mixin.py", line 127, in cuda
    return super().cuda(device=device)
  File "/root/miniconda3/envs/sd_GPU/lib/python3.10/site-packages/torch/nn/modules/module.py", line 689, in cuda
    return self._apply(lambda t: t.cuda(device))
  File "/root/miniconda3/envs/sd_GPU/lib/python3.10/site-packages/torch/nn/modules/module.py", line 579, in _apply
    module._apply(fn)
  File "/root/miniconda3/envs/sd_GPU/lib/python3.10/site-packages/torch/nn/modules/module.py", line 579, in _apply
    module._apply(fn)
  File "/root/miniconda3/envs/sd_GPU/lib/python3.10/site-packages/torch/nn/modules/module.py", line 579, in _apply
    module._apply(fn)
  [Previous line repeated 1 more time]
  File "/root/miniconda3/envs/sd_GPU/lib/python3.10/site-packages/torch/nn/modules/module.py", line 602, in _apply
    param_applied = fn(param)
  File "/root/miniconda3/envs/sd_GPU/lib/python3.10/site-packages/torch/nn/modules/module.py", line 689, in <lambda>
    return self._apply(lambda t: t.cuda(device))
  File "/root/miniconda3/envs/sd_GPU/lib/python3.10/site-packages/torch/cuda/__init__.py", line 217, in _lazy_init
    torch._C._cuda_init()
RuntimeError: Unexpected error from hipGetDeviceCount(). Did you run some cuda functions before calling NumHipDevices() that might have already set an error? Error 101: hipErrorInvalidDevice

用的显卡是GTX 980 Ti 系统Debian11 ，cuda版本：cuda-11.4

(sd_GPU) root@debian:/home/LYF/stablediffusion/stablediffusion-main# nvidia-smi
Fri Jan 13 10:04:08 2023       
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 470.161.03   Driver Version: 470.161.03   CUDA Version: 11.4     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|                               |                      |               MIG M. |
|===============================+======================+======================|
|   0  NVIDIA GeForce ...  On   | 00000000:01:00.0 Off |                  N/A |
| 22%   43C    P8    27W / 250W |      1MiB /  6075MiB |      0%      Default |
|                               |                      |                  N/A |
+-------------------------------+----------------------+----------------------+
                                                                               
+-----------------------------------------------------------------------------+
| Processes:                                                                  |
|  GPU   GI   CI        PID   Type   Process name                  GPU Memory |
|        ID   ID                                                   Usage      |
|=============================================================================|
|  No running processes found                                                 |
+-----------------------------------------------------------------------------+

所以请问这是什么问题呢？是cuda版本问题吗？还是显卡驱动的问题？非常感谢(◍•ᴗ•◍)

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
爱晚乏客游 2023-01-13 12:46
关注
输入 nvcc -V看下，你截图的这个的cuda根本不是你安装的cuda，而是你目前的驱动支持到cuda11.4。
总共有三个东西，一个是显卡驱动，这个会显示你目前显卡的驱动可以支持到最高的cuda版本
另外就是cuda和cudnn，这两个才是神经网络框架要的东西

例如我下面的截图，nvidia-smi出来的是驱动，版本512.72支持到11.6的cuda，而我实际安装的cuda是11.4

所以你这个是cuda没有安装，或者cudnn没有安装。具体安装可以搜索下linux下面安装cuda

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报编辑记录

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

torch问题-（stable diffusion2.0） linux python pytorch
2023-01-13 10:10

回答 1 已采纳输入 nvcc -V看下，你截图的这个的cuda根本不是你安装的cuda，而是你目前的驱动支持到cuda11.4。总共有三个东西，一个是显卡驱动，这个会显示你目前显卡的驱动可以支持到最高的cuda版本
kaggle云端部署的stable diffusion运行时Lora模块没法儿用 python
2023-03-27 12:09

回答 2 已采纳看起来是lora.py文件中的lora_apply_weights函数出了问题，函数中使用了“|”操作符，但是“|”操作符不支持type类型，所以报错了。可以尝试把“|”操作符改成“or”，看看是否可
ModuleNotFoundError: No module named 'torch'问题 python 人工智能有问必答
2021-12-03 16:42

回答 1 已采纳意思是程序没有找到模块torch。你需要打开cmd，执行pip install torch命令。
【AI】Stable-Diffusion-WebUI使用指南
2023-06-03 21:27

Goulandis的博客机器自然无法直接理解，所以首先需要经过一次文本编码，将自然语言编程成机器能够理解的字节码，Stable-Diffusion模型采用了Clip中文本编码器，Clip(Constastive Language-Image Pretraining)是OpenAI开源的一个深度...
cuda与torch匹配问题 python pytorch
2022-09-23 18:53

回答 2 已采纳应该是RTX3050Ti是版本比较新，所以cuda需要11.X 可以参考https://blog.csdn.net/zc19981224/article/details/119705267?ops_
关于torch.cat拼接问题 python 深度学习
2022-03-03 15:18

回答 1 已采纳你这只能按列拼接，按行拼接link_od两列数据，etaODAVG一列数据肯定不行啊 x_lstm = torch.cat((link_od,etaODAVG),1)，#按列拼接 tensor([[
应该怎么解决pip安装torch的version问题 python
2022-01-28 21:21

回答 1 已采纳先去官网查查，看看最近的torch支持的是哪个版本的python，然后检查一下你自己的python版本。
如何在亚马逊 SageMaker 进行 Stable Diffusion 模型在线服务部署
2023-04-07 20:29

墨理学AI的博客人人都有机会成为前沿的技术探索者 Stable Diffusion 2.0 和 chatGPT 等系列模型在计算机视觉和自然语言处理两大AI应用领域的优异表现，引起学术界和工业界的极大轰动，人工智能事业发展似乎迎来了又一个春天。...
python3.6下载torch-0.4.0-cp36-cp36m-win_amd64 .whl还是不匹配 python 人工智能有问必答
2021-10-08 13:04

回答 2 已采纳你可以看一下你的系统是64位的吗？如果是，你可以试一下 conda install pytorch torchvision cpuonly -c pytorch就是可能有点慢
安装torch时发生错误，不知道如何解决 python pytorch
2022-11-19 15:16

回答 2 已采纳 conda有时候就是会有些莫名其妙的问题，可以考虑重新创建一个虚拟环境。有可能anaconda出问题了，重新安装一个anaconda
安装 torch_sparse 的问题 python 有问必答
2021-04-25 11:33

回答 1 已采纳问题解决：直接在https://pytorch-geometric.com/whl/torch-1.6.0.html 下载好安装包，进行安装即可：
20分钟搞定 Stable Diffusion 模型在线服务部署
2023-06-08 22:05

墨理学AI的博客近期各个大厂的AI绘画产品也相继出炉，而对于个人使用者和喜欢尝鲜的开发者而言，最值得体验的两款AI绘画产品莫过于 Midjourney 和 Stable Diffusion；Midjourney 是一款商业AI绘画工具，借助于 Discord 服务平台...
关于#pytorch#的问题：pytorch1.3.0 + cuda101对应的Pyg库（torch-geometric及相应依赖）官网不在提供，请问还有什么途径可以下载安装吗(语言-python) python pytorch
2022-11-21 11:34

回答 1 已采纳最简单的方案是，根据现有的pyg库的需求配置环境，比如cuda要求什么给什么等。比如目前好像最低是torch1.4和cuda10.2.如果这个无法接受，那么只能从源码安装的方式来安装了，具体请看htt
Stable Diffusion原理详解（附代码实现）
2024-02-05 09:19

程序员晓晓的博客今天我们以GAN开始，介绍了AI绘画领域的一些模型，并把Stable Diffusion作为今天的主角，详解介绍了Stable Diffusion的实现原理。我们还使用Diffusers模块实现了Stable Diffusion生成图像的代码。在Stable Diffusion...
给想玩AI的新手｜Stable Diffusion 保姆级入门手册
2024-07-01 13:42

写编程的木木的博客 Stable Diffusion作为一款高性能模型，它生成的图像质量更高、运行速度更快、消耗的资源以及内存占用更小，是AI图像生成领域的里程碑。本篇文章作者将手把手教大家入门 Stable Diffusion，可以先收藏再浏览，避免...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 1月25日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 1月17日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 1月13日

悬赏问题

¥15 Stata链式中介效应代码修改
¥15 latex投稿显示click download
¥15 请问读取环境变量文件失败是什么原因？
¥15 在若依框架下实现人脸识别
¥15 添加组件无法加载页面,某块加载卡住
¥15 网络科学导论，网络控制
¥100 安卓tv程序连接SQLSERVER2008问题
¥15 利用Sentinel-2和Landsat8做一个水库的长时序NDVI的对比，为什么Snetinel-2计算的结果最小值特别小，而Lansat8就很平均
¥15 metadata提取的PDF元数据，如何转换为一个Excel
¥15 关于arduino编程toCharArray()函数的使用

torch问题-（stable diffusion2.0）

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新