最厉害的小白啊 2025-02-23 15:57 采纳率: 0%
浏览 325

RuntimeError: CUDA error: CUDA-capable device(s) is/are busy or unavailable

Y9000P电脑一旦合上屏幕,让电脑待机再打开之后就无法正常使用CUDA
需要重启才能正常使用,为什么?
RuntimeError: CUDA error: CUDA-capable device(s) is/are busy or unavailable

return t.to(device, dtype if t.is_floating_point() or t.is_complex() else None, non_blocking)
RuntimeError: CUDA error: CUDA-capable device(s) is/are busy or unavailable
CUDA kernel errors might be asynchronously reported at some other API call, so the stacktrace below might be incorrect.
For debugging consider passing CUDA_LAUNCH_BLOCKING=1.
Compile with `TORCH_USE_CUDA_DSA` to enable device-side assertions.

发现不能使用cuda。

>>> torch.cuda.is_available()
/home/ww/anaconda3/envs/loma/lib/python3.9/site-packages/torch/cuda/__init__.py:107: UserWarning: CUDA initialization: CUDA unknown error - this may be due to an incorrectly set up environment, e.g. changing env variable CUDA_VISIBLE_DEVICES after program start. Setting the available devices to be zero. (Triggered internally at ../c10/cuda/CUDAFunctions.cpp:109.)
  return torch._C._cuda_getDeviceCount() > 0
False
  • 写回答

3条回答 默认 最新

  • 阿里嘎多学长 2025-02-23 15:57
    关注

    阿里嘎多学长整理AIGC生成,因移动端显示问题导致当前答案未能完全显示,请使用PC端查看更加详细的解答过程

    RuntimeError: CUDA error: CUDA-capable device(s) is/are busy or unavailable

    问题分析

    用户的问题是,Y9000P电脑一旦合上屏幕,让电脑待机再打开之后就无法正常使用CUDA,需要重启才能正常使用。用户想知道为什么会出现这种情况。

    解决方案

    这个问题可能是由于CUDA设备在休眠状态下没有正确地释放资源,从而导致下一次使用CUDA时出现错误。有以下几种解决方案:

    1. 在休眠前,使用 nvidia-smi 命令来释放CUDA设备的资源。
    nvidia-smi -L
    
    1. 在休眠后,使用 nvidia-smi 命令来重新初始化CUDA设备。
    nvidia-smi -r
    
    1. 在代码中,使用 cudart 库提供的 cudaDeviceReset 函数来释放CUDA设备的资源。
    import cudart
    cudart.cudaDeviceReset()
    
    1. 如果以上方法都不能解决问题,可以尝试更新CUDA驱动程序或重新安装CUDA。

    结论

    总的来说,这个问题可能是由于CUDA设备在休眠状态下没有正确地释放资源导致的。可以尝试使用 nvidia-smi 命令或 cudart 库提供的函数来释放CUDA设备的资源,以解决这个问题。

    评论

报告相同问题?

问题事件

  • 修改了问题 4月7日
  • 创建了问题 2月23日