布豪我的手感 2025-10-10 11:16 采纳率: 0%
浏览 5

Linux服务器Tensorflow无法调用gpu

大师们求指点:
Ubuntu24.04系统
按照csdn和b站的教程,花了很多时间,依旧没有解决:
显卡是rtx5090 计算能力应该是12.0
tensorflow版本是pip自动匹配的是2.20然后系统级手动安装了12.5cuda toolkit和9.3cudnn (这个是根据tf官网给出的版本对应)
创建了虚拟环境跑模型出现ptx编译错误无法调用gpu必须把gpu禁用了,使用cpu才能跑,这就让我很疑惑因为毕竟没有gpu跑的太慢看到有博主说2.10以上的tf版本不支持gpu(不知道linux是不是)但是低版本的cuda tf不会发挥不出来显卡的性能吗,求一个解决方法,感谢

  • 写回答

5条回答 默认 最新

  • 阿里嘎多学长 2025-10-10 11:16
    关注

    阿里嘎多学长整理AIGC生成,因移动端显示问题导致当前答案未能完全显示,请使用PC端查看更加详细的解答过程

    解决方案

    根据你的描述,问题可能出在以下几个方面:

    1. 显卡驱动问题:RTX 5090 是一款高端显卡,可能需要手动安装最新的显卡驱动。可以尝试使用 nvidia-smi 命令检查显卡驱动版本,如果版本较低,可以尝试手动安装最新的驱动。
    2. TensorFlow配置问题:TensorFlow 2.20 支持 GPU 计算,但可能需要手动配置。可以尝试使用 tf.config.list_physical_devices('GPU') 命令检查是否支持 GPU 计算,如果不支持,可以尝试手动配置。
    3. 系统级TensorFlow问题:系统级 TensorFlow 可能与用户级 TensorFlow 冲突。可以尝试卸载系统级 TensorFlow,然后使用 pip 安装用户级 TensorFlow。

    核心代码

    # 检查显卡驱动版本
    nvidia-smi
    
    # 手动安装最新的显卡驱动
    sudo apt-get install nvidia-driver-515
    
    # 检查GPU支持
    import tensorflow as tf
    print(tf.config.list_physical_devices('GPU'))
    
    # 手动配置GPU
    import tensorflow as tf
    gpus = tf.config.list_physical_devices('GPU')
    if gpus:
        try:
            for gpu in gpus:
                tf.config.experimental.set_memory_growth(gpu, True)
        except RuntimeError as e:
            print(e)
    

    建议

    1. 检查系统日志和 TensorFlow 日志,可能有相关的错误信息。
    2. 尝试使用 tf.test.is_gpu_available() 函数检查 GPU 是否可用。
    3. 如果问题仍然存在,可以尝试使用 tf.config.set_visible_devices() 函数设置可见的 GPU 设备。
    评论

报告相同问题?

问题事件

  • 创建了问题 10月10日