evil_mons 2024-11-06 00:11 采纳率: 0%
浏览 78

同环境不同电脑cusolverDnCreate(&cusolver_dn_handle) == CUSOLVER_STATUS_SUCCESS Failed to create cuSo解决方法

都是Anaconda创建的虚拟环境,python3.9,cuda11.2,cudnn8.1,tensorflow-gpu2.6.0,其他配置conda list查看都一样,但是一个笔记本显卡1650ti,一个台式显卡4060Ti,笔记本可以正常跑起来,但是台式机总会返回Check failed: cusolverDnCreate(&cusolver_dn_handle) == CUSOLVER_STATUS_SUCCESS Failed to create cuSolverDN instance.

有没有遇到同样情况的佬知道什么情况,能不能指教下解决方法?

img

img

  • 写回答

1条回答 默认 最新

  • 香格里辣 2024-11-06 00:12
    关注

    以下回复参考:皆我百晓生券券喵儿等免费微信小程序作答:

    这个问题涉及到TensorFlow在台式机上使用cuSolverDN库时出现的错误。尽管两个环境都配置了相同的软件和库版本,但可能存在一些硬件或配置上的差异导致这个问题。以下是可能的解决方案和步骤,您可以尝试逐一排查问题:

    1. 确认CUDA和cuSolverDN安装正确:确保在台式机上正确安装了CUDA和cuSolverDN库。您可以尝试重新安装这些库,确保安装过程中没有出现错误。
    2. 检查显卡驱动:确认台式机的显卡驱动程序是否安装正确并且是最新版本。有时,过时的驱动程序可能会导致与TensorFlow的兼容性问题。
    3. 检查CUDA设备:使用nvidia-smi命令检查台式机的GPU设备是否可见且正常工作。确保CUDA设备列表中的GPU与您的TensorFlow版本兼容。
    4. 确认cuSolverDN库版本与CUDA版本匹配:确保cuSolverDN库的版本与CUDA版本相匹配。不同版本的CUDA可能需要不同版本的cuSolverDN库。
    5. 检查环境变量设置:确保在台式机的环境中设置了正确的环境变量。根据您提供的代码片段,似乎缺少了设置CUDA_VISIBLE_DEVICES环境变量的值。您应该指定要使用的GPU的ID,例如os.environ['CUDA_VISIBLE_DEVICES'] = "0"(假设您只有一块GPU)。
    6. 检查TensorFlow版本与硬件的兼容性:确认TensorFlow 2.6.0与您的台式机的GPU和驱动程序是否兼容。某些新版本的GPU可能需要更高版本的TensorFlow。
    7. 查看详细的日志信息:增加日志的详细级别,以获取更详细的错误信息。这可能会提供更多关于问题的线索。
    8. 尝试其他版本的TensorFlow和cuSolverDN:如果上述步骤都无法解决问题,您可以尝试降级TensorFlow的版本或升级cuSolverDN的版本,看是否能够解决问题。

    如果以上方法都不能解决问题,建议查阅相关的官方文档或社区论坛,看看是否有其他用户遇到了类似的问题并提供了解决方案。在某些情况下,可能需要更深入地调查硬件和配置问题。

    评论

报告相同问题?

问题事件

  • 创建了问题 11月6日