嘉然今天吃不完 2024-04-27 18:33 采纳率: 75%
浏览 14

Linux升级后无法使用GPU

在使用nvidia-smi命令时,出现以下情况

img

服务器基本配置如下

img

内核驱动版本

img

nvidia服务

img

已安装nvidia驱动版本信息

img

cuda版本

img

是因为服务器内核版本冲突的问题吗

  • 写回答

2条回答 默认 最新

  • 阿里嘎多学长 2024-04-27 18:35
    关注

    以下内容由CHATGPT及阿里嘎多学长共同生成、有用望采纳:


    【图片内容】:

    1. 第一张图片显示了nvidia-smi命令执行失败,提示无法与NVIDIA驱动通信,并建议确保安装了最新的NVIDIA驱动。
    2. 第二张图片显示了服务器的内核版本信息,为Linux node01 3.10.0-1160.el7.x86_64。
    3. 第三张图片显示了GCC版本信息,为GCC 5.2.0。
    4. 第四张图片显示了服务器中可用的内核版本,包括3.10.0-1127.el7.x86_64。
    5. 第五张图片显示了系统中安装的NVIDIA驱动版本,为nvidia-open-550.54.15。
    6. 第六张图片显示了CUDA编译工具的版本信息,为CUDA 12.2.140。

    【问题概括】: 用户在Linux服务器上升级后,发现无法使用GPU。具体表现为执行nvidia-smi命令时出现错误,提示NVIDIA驱动通信失败。

    【问题出现原因】: 问题可能出现的原因包括:

    1. NVIDIA驱动版本与当前系统内核版本不兼容。
    2. NVIDIA驱动可能未正确安装或配置。
    3. CUDA版本与NVIDIA驱动版本之间可能存在不兼容。

    【问题解决方案】:

    1. 确认当前系统内核版本与NVIDIA驱动版本是否兼容。如果内核升级后不兼容,可能需要升级NVIDIA驱动到一个与新内核兼容的版本。
    2. 重新安装或更新NVIDIA驱动,确保驱动程序与当前系统版本兼容。
    3. 验证CUDA版本是否与NVIDIA驱动版本兼容。如果不兼容,需要升级或降级CUDA版本。

    【提供代码】: 以下是更新NVIDIA驱动的一般步骤,具体命令可能根据系统和驱动版本有所不同:

    # 停止所有使用NVIDIA GPU的进程
    nvidia-smi --gpu-reset -i
    
    # 卸载当前的NVIDIA驱动
    sudo rpm -e nvidia-open-550.54.15
    
    # 下载与当前系统内核版本兼容的NVIDIA驱动
    # 具体下载链接需要根据内核版本和NVIDIA驱动版本确定
    
    # 安装新的NVIDIA驱动
    sudo sh NVIDIA-Linux-x86_64-<version>.run
    
    # 安装完成后,重新启动系统
    sudo reboot
    

    【代码运行方式】:

    1. 需要在Linux服务器上具有root权限的用户运行上述命令。
    2. 确保下载的NVIDIA驱动版本与当前系统内核版本兼容。

    【代码预期运行结果】: 如果操作正确,系统重启后nvidia-smi命令应该能够成功执行,显示GPU的状态信息。

    【推荐相关链接】:

    1. NVIDIA官方驱动下载
    2. CUDA Toolkit官方文档
    3. Linux内核升级文档

    请注意,上述命令和链接仅供参考,具体操作前应确认与您的系统和软件版本相匹配。

    评论 编辑记录

报告相同问题?

问题事件

  • 创建了问题 4月27日

悬赏问题

  • ¥15 有偿请教计算电磁学的问题涉及到空间中时域UTD和FDTD算法结合的
  • ¥15 vite打包后,页面出现h.createElement is not a function,但本地运行正常
  • ¥15 Java,消息推送配置
  • ¥15 Java计划序号重编制功能,此功能会对所有序号重新排序,排序后不改变前后置关系。
  • ¥15 关于哈夫曼树应用得到一些问题
  • ¥15 使用sql server语句实现下面两个实验(需要代码和运行结果截图)
  • ¥20 用web解决,要给我一个完整的网页,符合上述的要求
  • ¥20 求个sql server代码和结果的图 两道题
  • ¥15 银河麒麟操作系统无法使用U盘
  • ¥100 寻找:光电二极管电路设计服务