Javirs888
2020-04-14 09:50
采纳率: 50%
浏览 1.2k

Darknet yolov3训练数据,为何载入迭代200次的数据开始训练控制台却显示从100次开始运行?

如题。
本人在做毕业设计,因疫情影响无法回学校用良好的设备训练模型,只能用自己的计算机硬跑,目标先跑个1000次。
一上午大概能迭代100次,但如果从0到100再继续训练就会在154次左右出现大量的nan,于是我退出,载入100次时候保留的权重成功跑到200并保存有权重文件。
今早我打算故技重施,可载入200次权重文件跑的时候却显示从100开始,然后101,102。我太难了。
有没有懂的兄弟可以说说原因和解决办法?跪谢!

  • 写回答
  • 好问题 提建议
  • 关注问题
  • 收藏
  • 邀请回答

1条回答 默认 最新

  • m0_37628688 2020-04-27 07:54
    已采纳

    我也是遇见这个问题,本来是忘记改了原来的50200,幸运的是迭代到134次时,电脑卡退了,我再重新训练时改迭代次数,发现在100以下的,用保存的最后的权重模型去训练时直接就不训练了,然后改成了150次,可以训练了,但和你说的一样从101开始而不是从134开始,当时没在意,原来这还是个问题呢,之后陆续改了150、200、250、1000也没发生类似问题都是从前依次截止权重开始训练的,我的建议是你可以把迭代次数再写高点,因为我发现迭代1000次始,程序自动保存了此时的权重模型,你也可以将源代码里这个自动保存模型的界限(1000)改成100,这样就会每100次保存一次模型,只要迭代次数使得目标损失降到源代码设定的阈值,程序还会自动保存最佳模型

    已采纳该答案
    评论
    解决 无用
    打赏 举报

相关推荐 更多相似问题