weixin_40839405 2021-05-24 20:51 采纳率: 0%
浏览 73

关于神经网络训练与测试过程中的BN层参数?

为什么一般我们在训练网络的时候设置model.train(),不固定BN层参数,但是在测试过程使用model.eval()固定BN层参数。那么在训练过程中BN层参数是怎么变化的?为什么一些代码在训练时也设置model.eval()固定BN层参数?

  • 写回答

1条回答 默认 最新

  • 影醉阏轩窗 2021-05-25 11:54
    关注

    1. 关于BN的理论网上一大堆。

    2. BN是个可学习的参数,所以训练学习,前向计算固定,和weight一样。

    3. 训练阶段使用eval固定BN,和去除BN无区别。当然在蒸馏的时候,大模型固定,小模型不固定。

    评论

报告相同问题?