weixin_55061897 2022-12-07 20:22 采纳率: 60%
浏览 77
已结题

AMD利用ubuntu部署NovaAI报错

利用ubuntu支持的ROCM对novaAI进行部署,万事具备,就卡在了最后一步
被曝出不知道是内存不足还是显存不足的,真的好难受阿
显卡用的是蓝宝石RX6500XT4G,内存是威刚的DDR4,8G内存条
真的很想玩NovaAI
报错如下;

Commit hash: 3e15f8e0f5cc87507f77546d92435670644dbd18
Installing requirements for Web UI
Launching Web UI with arguments: --precision full --no-half
LatentDiffusion: Running in eps-prediction mode
DiffusionWrapper has 859.52 M params.
making attention of type 'vanilla' with 512 in_channels
Working with z of shape (1, 4, 32, 32) = 4096 dimensions.
making attention of type 'vanilla' with 512 in_channels
Loading weights [925997e9] from /home/ai/stable-diffusion-webui/models/Stable-diffusion/novelaifinal-pruned.ckpt
Traceback (most recent call last):
  File "launch.py", line 206, in <module>
    start_webui()
  File "launch.py", line 201, in start_webui
    webui.webui()
  File "/home/ai/stable-diffusion-webui/webui.py", line 129, in webui
    initialize()
  File "/home/ai/stable-diffusion-webui/webui.py", line 90, in initialize
    modules.sd_models.load_model()
  File "/home/ai/stable-diffusion-webui/modules/sd_models.py", line 236, in load_model
    sd_model.to(shared.device)
  File "/home/ai/stable-diffusion-webui/venv/lib/python3.8/site-packages/pytorch_lightning/core/mixins/device_dtype_mixin.py", line 113, in to
    return super().to(*args, **kwargs)
  File "/home/ai/stable-diffusion-webui/venv/lib/python3.8/site-packages/torch/nn/modules/module.py", line 927, in to
    return self._apply(convert)
  File "/home/ai/stable-diffusion-webui/venv/lib/python3.8/site-packages/torch/nn/modules/module.py", line 579, in _apply
    module._apply(fn)
  File "/home/ai/stable-diffusion-webui/venv/lib/python3.8/site-packages/torch/nn/modules/module.py", line 579, in _apply
    module._apply(fn)
  File "/home/ai/stable-diffusion-webui/venv/lib/python3.8/site-packages/torch/nn/modules/module.py", line 579, in _apply
    module._apply(fn)
  [Previous line repeated 5 more times]
  File "/home/ai/stable-diffusion-webui/venv/lib/python3.8/site-packages/torch/nn/modules/module.py", line 602, in _apply
    param_applied = fn(param)
  File "/home/ai/stable-diffusion-webui/venv/lib/python3.8/site-packages/torch/nn/modules/module.py", line 925, in convert
    return t.to(device, dtype if t.is_floating_point() or t.is_complex() else None, non_blocking)
RuntimeError: HIP out of memory. Tried to allocate 20.00 MiB (GPU 0; 3.98 GiB total capacity; 3.85 GiB already allocated; 46.00 MiB free; 3.94 GiB reserved in total by PyTorch) If reserved memory is >> allocated memory try setting max_split_size_mb to avoid fragmentation.  See documentation for Memory Management and PYTORCH_HIP_ALLOC_CONF


  • 写回答

1条回答 默认 最新

  • 爱晚乏客游 2022-12-08 09:50
    关注

    显存不足啊。另外,你这8G内存也有点不够的样子,python啥的吃内存还是挺多的。

    img


    还有就是试试看下报错这个提示,设置下max_split_size_mb,但是我觉得不一定好使。后面的64根据自己的情况调整一下看看,如果还是不行,那没救了,老实CPU吧(cpu我估计你也会内存不足),一般这种网络都得有大显存

    import os
    os.environ["PYTORCH_CUDA_ALLOC_CONF"] = "max_split_size_mb:64"
    
    
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

问题事件

  • 系统已结题 12月16日
  • 已采纳回答 12月8日
  • 创建了问题 12月7日

悬赏问题

  • ¥100 关于注册表摄像头和麦克风的问题
  • ¥30 代码本地运行正常,但是TOMCAT部署时闪退
  • ¥15 关于#python#的问题
  • ¥15 主机可以ping通路由器但是连不上网怎么办
  • ¥15 数据库一张以时间排好序的表中,找出多次相邻的那些行
  • ¥50 关于DynamoRIO处理多线程程序时候的问题
  • ¥15 kubeadm部署k8s出错
  • ¥15 Abaqus打不开cae文件怎么办?
  • ¥20 双系统开机引导中windows系统消失问题?
  • ¥15 小程序准备上线,软件开发公司需要提供哪些资料给甲方