如题。
本人在做毕业设计,因疫情影响无法回学校用良好的设备训练模型,只能用自己的计算机硬跑,目标先跑个1000次。
一上午大概能迭代100次,但如果从0到100再继续训练就会在154次左右出现大量的nan,于是我退出,载入100次时候保留的权重成功跑到200并保存有权重文件。
今早我打算故技重施,可载入200次权重文件跑的时候却显示从100开始,然后101,102。我太难了。
有没有懂的兄弟可以说说原因和解决办法?跪谢!

Darknet yolov3训练数据,为何载入迭代200次的数据开始训练控制台却显示从100次开始运行?
- 写回答
- 好问题 0 提建议
- 关注问题
- 邀请回答
-
1条回答 默认 最新
- Bobma123 2020-04-27 07:54关注
我也是遇见这个问题,本来是忘记改了原来的50200,幸运的是迭代到134次时,电脑卡退了,我再重新训练时改迭代次数,发现在100以下的,用保存的最后的权重模型去训练时直接就不训练了,然后改成了150次,可以训练了,但和你说的一样从101开始而不是从134开始,当时没在意,原来这还是个问题呢,之后陆续改了150、200、250、1000也没发生类似问题都是从前依次截止权重开始训练的,我的建议是你可以把迭代次数再写高点,因为我发现迭代1000次始,程序自动保存了此时的权重模型,你也可以将源代码里这个自动保存模型的界限(1000)改成100,这样就会每100次保存一次模型,只要迭代次数使得目标损失降到源代码设定的阈值,程序还会自动保存最佳模型
本回答被题主选为最佳回答 , 对您是否有帮助呢?解决 无用评论 打赏 举报