tensorflow-gpu版模型不训练直接结束进程是什么情况

问题遇到的现象和发生背景

之前用的tensorflow_cpu版训练太慢，换成gpu后训练直接结束进程了是什么情况

遇到的现象和发生背景，请写出第一个错误信息

用代码块功能插入代码，请勿粘贴截图。不用代码块回答率下降 50%


model.fit(
    x=train_dataloader,
    steps_per_epoch=epoch_step,
    validation_data=val_dataloader,
    validation_steps=epoch_step_val,
    epochs=end_epoch,
    initial_epoch=start_epoch,
    use_multiprocessing=True if num_workers > 1 else False,
    workers=num_workers,
    callbacks = callbacks
)

运行结果及详细报错内容

GeForce RTX 3050 Ti Laptop GPU, pci bus id: 0000:01:00.0, compute capability: 8.6

Epoch 1: LearningRateScheduler setting learning rate to 2.9999999999999997e-05.
Epoch 1/50
C:\Users\97394\AppData\Local\Programs\Python\Python39\lib\site-packages\tensorflow\python\framework\indexed_slices.py:444: UserWarning: Converting sparse IndexedSlices(IndexedSlices(indices=Tensor("gradient_tape/model_1/yolo_loss/while/gradients/model_1/yolo_loss/while/cond_grad/gradients/model_1/yolo_loss/while/cond/GatherNd_2_grad/Squeeze:0", shape=(None,), dtype=int64), values=Tensor("gradient_tape/model_1/yolo_loss/while/gradients/model_1/yolo_loss/while/cond_grad/gradients/grad_ys_2:0", shape=(None, None), dtype=float32), dense_shape=Tensor("gradient_tape/model_1/yolo_loss/while/gradients/model_1/yolo_loss/while/cond_grad/gradients/model_1/yolo_loss/while/cond/GatherNd_2_grad/Shape:0", shape=(2,), dtype=int64))) to a dense Tensor of unknown shape. This may consume a large amount of memory.
warnings.warn(
2022-12-08 19:25:08.232598: I tensorflow/stream_executor/cuda/cuda_dnn.cc:384] Loaded cuDNN version 8101

进程已结束,退出代码-1073740791 (0xC0000409)

我的解答思路和尝试过的方法，不写自己思路的，回答率下降 60%

会是gpu版本的cuda跟cudnn的问题吗，但我重装了好几遍了，也可能是内存溢出的情况

我想要达到的结果，如果你需要快速回答，请尝试 “付费悬赏”

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
PellyKoo 2022-12-09 09:46
关注
GeForce RTX 3050 Ti Laptop GPU这块显卡的显存只有4G，做深度学习似乎有点太小了，你可以把batch_size设置为1，再看看能不能走通

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

使用tensorflow-gpu无法训练模型？ python tensorflow ubuntu
2021-08-09 15:02

回答 2 已采纳看你的运行结果是你的cuda版本过于低，gpu的性能没有完全利用，观察你的loss几乎没有变化，loss要下降趋势才是正常运行结果，调整一下超参数试试
anaconda安装tensorflow-gpu tensorflow 深度学习
2022-01-24 22:16

回答 2 已采纳你都没有安装成功，网络下载失败了首先安装这个换下镜像源 conda和pip如何切换为清华镜像源 - 简书一、conda切换为清华镜像源提
tensorflow-gpu运行神经网络时一训练内核就失联 python tensorflow
2023-03-10 22:45

回答 4 已采纳参考GPT和自己的思路：出现内核崩溃的原因可能有很多，以下是一些可能的解决方案： 1 确保你的TensorFlow-GPU版本与CUDA和cuDNN版本兼容。可以参考TensorFlow官方网站提供
Tensorflow-gpu安装教程（详细）！！！
2023-01-04 19:43

Hacker Belial的博客在安装过程中呢，最重要的莫过于tensorflow，python及其依赖项的版本对应了，如果安装了版本不对应的cuda或者cudnn，可能会导致一系列的问题而最终不能正常地调用设备的GPU进行工作了。所以我们在安装的时候必须时刻...
TensorFlow-gpu安装问题（提示正在寻找匹配的pip版本） python 机器学习深度学习
2021-05-27 20:02

回答 2 已采纳他在找匹配版本。这里建议检查一下tensorflow-gpu和你的cuda 还有cudnn是否都匹配，去官网查一下，是否兼容。大概率是这里的问题，然后删除旧版本统一后重新安装就行了。
关于#TensorFlow-GPU#的问题，运行结果中的提示信息如何解读？ python tensorflow 机器学习
2022-02-25 14:58

回答 1 已采纳一般只要不是E或者error报错，可以都不管，是tf输出的一些日志信息
tensorflow-gpu进行3DUnet训练，jupyter出现服务重启？ tensorflow 人工智能机器学习深度学习神经网络
2020-04-28 10:03

回答 1 已采纳笔记本的显示卡散热不行，显存也小，所以不稳定。建议你找桌面GTX1060/1660以上的卡来测试。
TensorFlow
2022-07-09 13:33

star.29的博客 TensorFlow是一个基于数据流编程（dataflow programming）的符号数学系统，被广泛应用于各类机器学习（machine learning）算法的编程实现，其前身是谷歌的神经网络算法库DistBelief 。Tensorflow拥有多层级结构，可...
tensorflow2.8.0对应的cuda版本应该是多少？ tensorflow 深度学习
2022-05-06 13:21

回答 2 已采纳 11.3
tensorflow-gpu调用代码 python tensorflow 深度学习
2023-03-01 20:10

回答 2 已采纳最新版本的tensorflow就是默认是GPU训练的，如果你电脑上有合适的GPU他就默认开启GPU，如果没有GPU他就自动切到CPU，代码是一样的，不需要特别针对GPU进行开发相应的代码。
tensorflow-gpu为何无法调用GPU进行运算？ tensorflow
2018-11-08 07:30

回答 5 已采纳在 https://ask.csdn.net/questions/710166 回答你了，如果满意，请点我回答左上角的箭头和采纳。谢谢
keras tensorflow 实现在python下多进程运行
2020-09-18 00:27

在Python编程环境中，多进程（multiprocessing）是一种有效的利用多核CPU资源的方式，特别是在处理计算密集型任务如深度学习模型训练时。Keras是一个高级神经网络API，它构建在TensorFlow之上，允许用户轻松地创建和...
tensorflow-gpu为何无法调用GPU进行运算??? tensorflow
2018-11-08 07:52

回答 3 已采纳 GT730有好几种，一个是GT640的马甲卡，采用Kepler核心，384 CUDA Cores，叫做GK208/GK107，反正有个K，这个支持CUDA 3.0，可以跑TF（但是相当慢）还有一个
Linux16.04配置tensorflow(GPU源码编译)并深入了解tensorboard
2019-11-21 22:33

haoji007的博客 Tensorflow– Google推出的一个强大的“深度学习框架”。于2015年11月在GIthub上开源，在2016年4月补充了分布式版本，并于2017年1月发布了1.0版本的预览，API接口趋于稳定。目前Tensorflow仍处于快速开发迭代过程中...
TensorFlow在美团外卖推荐场景的GPU训练优化实践
2022-03-24 20:00

美团技术团队的博客总第497篇2022年第014篇美团机器学习平台基于内部深度定制的TensorFlow研发了Booster GPU训练架构。该架构在整体设计上充分考虑了算法、架构、新硬件的特性，从数据、计算、通信等多个角度进行了深度的优化，最终其...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 12月8日

悬赏问题

¥15 is not in the mmseg::model registry。报错，模型注册表找不到自定义模块。
¥15 安装quartus II18.1时弹出此error，怎么解决？
¥15 keil官网下载psn序列号在哪
¥15 想用adb命令做一个通话软件，播放录音
¥30 Pytorch深度学习服务器跑不通问题解决？
¥15 部分客户订单定位有误的问题
¥15 如何在maya程序中利用python编写领子和褶裥的模型的方法
¥15 Bug traq 数据包大概什么价
¥15 在anaconda上pytorch和paddle paddle下载报错
¥25 自动填写QQ腾讯文档收集表