GUO jin 2021-04-24 13:22 采纳率: 33.3%
浏览 410

使用GPU训练pytorch模型,第一次训练和第二次训练对应的epoch结果完全相同

我最近在用GPU训练一个pytorch的模型,遇到了一些问题。

同样的参数我想要训练模型多次,对模型的ap取平均值,但是遇到了一个问题,第二次训练完完全全是对第一次训练结果的重复,第二次训练的第一个epoch,跟第一次训练的第一个epoch,loss值、ap值完全相同,以此类推,最后得到的结果也一模一样

这张图是第一次训练的第一个epoch结果

这张图是第二次训练的第一个epoch结果

可以看到结果完全是一样的(模型可以正常收敛的,多次训练的最终结果也完全一样)

用cpu训练就完全没有这个问题,求各位大佬解答,现在都不知道GPU这样跑出来的结果是不是可靠的。

  • 写回答

1条回答 默认 最新

  • GUO jin 2021-06-24 16:49
    关注

    已经解决了,是代码中设置了一个随机种子,设置随机种子以后GPU每次初始化参数都是完全相同的

    评论

报告相同问题?

悬赏问题

  • ¥15 在获取boss直聘的聊天的时候只能获取到前40条聊天数据
  • ¥20 关于URL获取的参数,无法执行二选一查询
  • ¥15 液位控制,当液位超过高限时常开触点59闭合,直到液位低于低限时,断开
  • ¥15 marlin编译错误,如何解决?
  • ¥15 有偿四位数,节约算法和扫描算法
  • ¥15 VUE项目怎么运行,系统打不开
  • ¥50 pointpillars等目标检测算法怎么融合注意力机制
  • ¥20 Vs code Mac系统 PHP Debug调试环境配置
  • ¥60 大一项目课,微信小程序
  • ¥15 求视频摘要youtube和ovp数据集