tensorflow-gpu运行神经网络时一训练内核就失联

tensorflow-gpu运行神经网络时一训练内核就失联tensorflow-gpu运行神经网络时一训练内核就失联，调节batch_size无效，且内核崩溃时显存还没有用完

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

4条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
「已注销」 2023-03-10 22:49
关注
参考GPT和自己的思路：出现内核崩溃的原因可能有很多，以下是一些可能的解决方案：

1 确保你的TensorFlow-GPU版本与CUDA和cuDNN版本兼容。可以参考TensorFlow官方网站提供的兼容性矩阵。

2 如果你使用的是Jupyter Notebook或者其他类似的交互式编程环境，尝试将你的代码移植到一个独立的Python脚本中运行，以避免一些可能的交互式编程环境的限制。

3 尝试降低batch_size以减少显存的压力。如果这并没有解决问题，可以尝试调整模型的结构，使其更加轻量化。

4 尝试更新你的GPU驱动程序。如果你的GPU驱动程序已经是最新的，也可以尝试回滚到较旧的版本。

5 尝试在代码中使用tf.debugging.set_log_device_placement(True)语句，以查看TensorFlow是如何将操作分配到GPU和CPU上的。这可能有助于找到问题的根本原因。
6 如果你使用的是Windows系统，可以尝试将环境变量TF_FORCE_GPU_ALLOW_GROWTH设置为true。这可能会使TensorFlow能够动态分配显存，从而避免内存溢出的问题。

7 最后，如果以上方法都没有解决问题，可以尝试升级你的GPU硬件，以增加显存和计算能力。

希望这些解决方案能够帮助你解决问题。

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(3条)

报告相同问题？

关注问题

tensorflow-gpu运行神经网络时一训练内核就失联 python tensorflow
2023-03-10 22:45

回答 4 已采纳参考GPT和自己的思路：出现内核崩溃的原因可能有很多，以下是一些可能的解决方案： 1 确保你的TensorFlow-GPU版本与CUDA和cuDNN版本兼容。可以参考TensorFlow官方网站提供
使用tensorflow-gpu无法训练模型？ python tensorflow ubuntu
2021-08-09 15:02

回答 2 已采纳看你的运行结果是你的cuda版本过于低，gpu的性能没有完全利用，观察你的loss几乎没有变化，loss要下降趋势才是正常运行结果，调整一下超参数试试
anaconda安装tensorflow-gpu tensorflow 深度学习
2022-01-24 22:16

回答 2 已采纳你都没有安装成功，网络下载失败了首先安装这个换下镜像源 conda和pip如何切换为清华镜像源 - 简书一、conda切换为清华镜像源提
Anaconda 安装Tensorflow-gpu 版本详细教程
2022-11-12 16:07

阿给—Unique的博客 Anaconda 安装Tensorflow-gpu 版本详细教程
关于#TensorFlow-GPU#的问题，运行结果中的提示信息如何解读？ python tensorflow 机器学习
2022-02-25 14:58

回答 1 已采纳一般只要不是E或者error报错，可以都不管，是tf输出的一些日志信息
请问用tensorflow-gpu加速的时候在训练的时候库好像还没加载完就开始训练了请问怎么办？？这样导致loss好大 tensorflow 深度学习神经网络
2022-10-28 18:20

回答 1 已采纳你理解错了，训练的时候其实库已经加载完了。只是输出信息在缓冲区并没有及时输出到屏幕，你可以设置以下tflog信息的输出级别，I级别的调试信息不用输出。模型一开始loss大是正常的，后面训练会慢慢降低的
TensorFlow-gpu安装问题（提示正在寻找匹配的pip版本） python 机器学习深度学习
2021-05-27 20:02

回答 2 已采纳他在找匹配版本。这里建议检查一下tensorflow-gpu和你的cuda 还有cudnn是否都匹配，去官网查一下，是否兼容。大概率是这里的问题，然后删除旧版本统一后重新安装就行了。
Windows安装 tensorflow-gpu
2021-06-21 19:20

CWY嘻嘻哈哈的博客 @利用机器GPU资源运行tensorflow 配置python虚拟环境安装anaconda anaconda是一个面向Python和R编程语言的综合的数据科学和机器学习平台，可满足大部分开发、实验需求。安装步骤简单，官网下载后按照默认项安装...
tensorflow-gpu进行3DUnet训练，jupyter出现服务重启？ tensorflow 人工智能机器学习深度学习神经网络
2020-04-28 10:03

回答 1 已采纳笔记本的显示卡散热不行，显存也小，所以不稳定。建议你找桌面GTX1060/1660以上的卡来测试。
tensorflow-gpu调用代码 python tensorflow 深度学习
2023-03-01 20:10

回答 2 已采纳最新版本的tensorflow就是默认是GPU训练的，如果你电脑上有合适的GPU他就默认开启GPU，如果没有GPU他就自动切到CPU，代码是一样的，不需要特别针对GPU进行开发相应的代码。
tensorflow-gpu Failed to get convolution algorithm. tensorflow 神经网络
2018-11-16 12:59

回答 1 已采纳 ![](https://img-bbs.csdn.net/upload/201811/16/1542381557_315523.gif) 我不知道这样算不算运行了，没有报错我的软硬件：
tensorflowGpu-2.3.0-cuda11.0-cudnn8.0-vs2019.rar
2020-11-11 11:22

首先，TensorFlow是一个开源的机器学习框架，它允许开发人员构建和训练各种类型的机器学习模型，包括深度神经网络。GPU版本的TensorFlow（即TensorFlow GPU）特别适用于需要大量并行计算的任务，如图像识别、自然...
tensorflow-gpu为何无法调用GPU进行运算？ tensorflow
2018-11-08 07:30

回答 5 已采纳在 https://ask.csdn.net/questions/710166 回答你了，如果满意，请点我回答左上角的箭头和采纳。谢谢
人工智能基础部分16-神经网络与GPU加速训练的原理与应用
2023-05-14 20:59

微学AI的博客大家好，我是微学AI，今天给大家介绍一下人工智能基础部分16-神经网络与GPU加速训练的原理与应用，在深度学习领域，神经网络已经成为了一种流行的、表现优秀的技术。然而，随着神经网络的规模越来越大，训练神经网络...
来自官方文档的Ubuntu 16.04 + tensorflow-GPU 配置
2018-09-22 21:21

passball的博客 install cudnn (深度神经网络库 Deep Neural Network library) 官方文档： http://docs.nvidia.com/deeplearning/sdk/cudnn-install/index.html 3.1 download cudnn （注意下载cudnn 6.0）读者别嫌...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 3月19日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 3月11日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 3月10日

悬赏问题

¥15 metadata提取的PDF元数据，如何转换为一个Excel
¥15 关于arduino编程toCharArray()函数的使用
¥100 vc++混合CEF采用CLR方式编译报错
¥15 coze 的插件输入飞书多维表格 app_token 后一直显示错误，如何解决？
¥15 vite+vue3+plyr播放本地public文件夹下视频无法加载
¥15 c#逐行读取txt文本，但是每一行里面数据之间空格数量不同
¥50 如何openEuler 22.03上安装配置drbd
¥20 ING91680C BLE5.3 芯片怎么实现串口收发数据
¥15 无线连接树莓派，无法执行update，如何解决？（相关搜索：软件下载）
¥15 Windows11, backspace, enter, space键失灵

tensorflow-gpu运行神经网络时一训练内核就失联

4条回答 默认 最新

问题事件

悬赏问题

4条回答默认最新