环境:win10,RTX3060,cuda 11.3 cudnn 11.3 python 3.9 tensorflow2.6.0
环境安装后测试: nvcc-v deviceQuery.exe 和 bandwithTest.exe运行正常
tf.test.is_gpu_available() 为true
故障:此环境在运行手写数字识别等简单任务时,均正常。使用tensorflow-yolo v3 做迁移训练时,无报错,常在第一轮结束就自动退出,Process finished with exit code -1。
加载模型进行目标检测时,图像能正常检测,视频则不出现检测框,过程中 cudnn均正常load 不报错。
尝试:试过重装tensorflow2.5,故障同样如此。也下载了github上其他tensorflow2-yolo 项目,故障也依旧。
把early stopping中参数 patience设置为 2就会训练到epoch 2自动终止,设置为3就会在epoch3自动终止。
请大佬指点指点 跳出坑😂