Blank_Kong 2022-12-08 19:31 采纳率: 0%
浏览 79

tensorflow-gpu版模型不训练直接结束进程是什么情况

问题遇到的现象和发生背景

之前用的tensorflow_cpu版训练太慢,换成gpu后训练直接结束进程了是什么情况

遇到的现象和发生背景,请写出第一个错误信息
用代码块功能插入代码,请勿粘贴截图。 不用代码块回答率下降 50%

model.fit(
    x=train_dataloader,
    steps_per_epoch=epoch_step,
    validation_data=val_dataloader,
    validation_steps=epoch_step_val,
    epochs=end_epoch,
    initial_epoch=start_epoch,
    use_multiprocessing=True if num_workers > 1 else False,
    workers=num_workers,
    callbacks = callbacks
)

运行结果及详细报错内容

GeForce RTX 3050 Ti Laptop GPU, pci bus id: 0000:01:00.0, compute capability: 8.6

Epoch 1: LearningRateScheduler setting learning rate to 2.9999999999999997e-05.
Epoch 1/50
C:\Users\97394\AppData\Local\Programs\Python\Python39\lib\site-packages\tensorflow\python\framework\indexed_slices.py:444: UserWarning: Converting sparse IndexedSlices(IndexedSlices(indices=Tensor("gradient_tape/model_1/yolo_loss/while/gradients/model_1/yolo_loss/while/cond_grad/gradients/model_1/yolo_loss/while/cond/GatherNd_2_grad/Squeeze:0", shape=(None,), dtype=int64), values=Tensor("gradient_tape/model_1/yolo_loss/while/gradients/model_1/yolo_loss/while/cond_grad/gradients/grad_ys_2:0", shape=(None, None), dtype=float32), dense_shape=Tensor("gradient_tape/model_1/yolo_loss/while/gradients/model_1/yolo_loss/while/cond_grad/gradients/model_1/yolo_loss/while/cond/GatherNd_2_grad/Shape:0", shape=(2,), dtype=int64))) to a dense Tensor of unknown shape. This may consume a large amount of memory.
warnings.warn(
2022-12-08 19:25:08.232598: I tensorflow/stream_executor/cuda/cuda_dnn.cc:384] Loaded cuDNN version 8101

进程已结束,退出代码-1073740791 (0xC0000409)

我的解答思路和尝试过的方法,不写自己思路的,回答率下降 60%

会是gpu版本的cuda跟cudnn的问题吗,但我重装了好几遍了,也可能是内存溢出的情况

我想要达到的结果,如果你需要快速回答,请尝试 “付费悬赏”


  • 写回答

1条回答 默认 最新

  • PellyKoo 2022-12-09 09:46
    关注

    GeForce RTX 3050 Ti Laptop GPU这块显卡的显存只有4G,做深度学习似乎有点太小了,你可以把batch_size设置为1,再看看能不能走通

    评论

报告相同问题?

问题事件

  • 创建了问题 12月8日

悬赏问题

  • ¥15 is not in the mmseg::model registry。报错,模型注册表找不到自定义模块。
  • ¥15 安装quartus II18.1时弹出此error,怎么解决?
  • ¥15 keil官网下载psn序列号在哪
  • ¥15 想用adb命令做一个通话软件,播放录音
  • ¥30 Pytorch深度学习服务器跑不通问题解决?
  • ¥15 部分客户订单定位有误的问题
  • ¥15 如何在maya程序中利用python编写领子和褶裥的模型的方法
  • ¥15 Bug traq 数据包 大概什么价
  • ¥15 在anaconda上pytorch和paddle paddle下载报错
  • ¥25 自动填写QQ腾讯文档收集表