林森 2021-09-03 09:36
浏览 77
已结题

tensorflow-gpu 2.6训练模型和目标检测 提前退出,Process finished with exit code -1

环境:win10,RTX3060,cuda 11.3 cudnn 11.3 python 3.9 tensorflow2.6.0

环境安装后测试: nvcc-v deviceQuery.exe 和 bandwithTest.exe运行正常
tf.test.is_gpu_available() 为true

故障:此环境在运行手写数字识别等简单任务时,均正常。使用tensorflow-yolo v3 做迁移训练时,无报错,常在第一轮结束就自动退出,Process finished with exit code -1。
加载模型进行目标检测时,图像能正常检测,视频则不出现检测框,过程中 cudnn均正常load 不报错。
尝试:试过重装tensorflow2.5,故障同样如此。也下载了github上其他tensorflow2-yolo 项目,故障也依旧。
把early stopping中参数 patience设置为 2就会训练到epoch 2自动终止,设置为3就会在epoch3自动终止。

请大佬指点指点 跳出坑😂

  • 写回答

0条回答 默认 最新

    报告相同问题?

    问题事件

    • 系统已结题 9月11日
    • 创建了问题 9月3日

    悬赏问题

    • ¥15 apm2.8飞控罗盘bad health,加速度计校准失败
    • ¥15 求解O-S方程的特征值问题给出边界层布拉休斯平行流的中性曲线
    • ¥15 谁有desed数据集呀
    • ¥20 手写数字识别运行c仿真时,程序报错错误代码sim211-100
    • ¥15 关于#hadoop#的问题
    • ¥15 (标签-Python|关键词-socket)
    • ¥15 keil里为什么main.c定义的函数在it.c调用不了
    • ¥50 切换TabTip键盘的输入法
    • ¥15 可否在不同线程中调用封装数据库操作的类
    • ¥15 微带串馈天线阵列每个阵元宽度计算