Javirs888 2020-04-14 09:50 采纳率: 50%
浏览 1519
已采纳

Darknet yolov3训练数据,为何载入迭代200次的数据开始训练控制台却显示从100次开始运行?

如题。
本人在做毕业设计,因疫情影响无法回学校用良好的设备训练模型,只能用自己的计算机硬跑,目标先跑个1000次。
一上午大概能迭代100次,但如果从0到100再继续训练就会在154次左右出现大量的nan,于是我退出,载入100次时候保留的权重成功跑到200并保存有权重文件。
今早我打算故技重施,可载入200次权重文件跑的时候却显示从100开始,然后101,102。我太难了。
有没有懂的兄弟可以说说原因和解决办法?跪谢!

  • 写回答

1条回答 默认 最新

  • Bobma123 2020-04-27 07:54
    关注

    我也是遇见这个问题,本来是忘记改了原来的50200,幸运的是迭代到134次时,电脑卡退了,我再重新训练时改迭代次数,发现在100以下的,用保存的最后的权重模型去训练时直接就不训练了,然后改成了150次,可以训练了,但和你说的一样从101开始而不是从134开始,当时没在意,原来这还是个问题呢,之后陆续改了150、200、250、1000也没发生类似问题都是从前依次截止权重开始训练的,我的建议是你可以把迭代次数再写高点,因为我发现迭代1000次始,程序自动保存了此时的权重模型,你也可以将源代码里这个自动保存模型的界限(1000)改成100,这样就会每100次保存一次模型,只要迭代次数使得目标损失降到源代码设定的阈值,程序还会自动保存最佳模型

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

悬赏问题

  • ¥15 C#算法问题, 不知道怎么处理这个数据的转换
  • ¥15 YoloV5 第三方库的版本对照问题
  • ¥15 请完成下列相关问题!
  • ¥15 drone 推送镜像时候 purge: true 推送完毕后没有删除对应的镜像,手动拷贝到服务器执行结果正确在样才能让指令自动执行成功删除对应镜像,如何解决?
  • ¥15 求daily translation(DT)偏差订正方法的代码
  • ¥15 js调用html页面需要隐藏某个按钮
  • ¥15 ads仿真结果在圆图上是怎么读数的
  • ¥20 Cotex M3的调试和程序执行方式是什么样的?
  • ¥20 java项目连接sqlserver时报ssl相关错误
  • ¥15 一道python难题3