为什么一般我们在训练网络的时候设置model.train(),不固定BN层参数,但是在测试过程使用model.eval()固定BN层参数。那么在训练过程中BN层参数是怎么变化的?为什么一些代码在训练时也设置model.eval()固定BN层参数?
1条回答 默认 最新
- 影醉阏轩窗 2021-05-25 11:54关注
1. 关于BN的理论网上一大堆。
2. BN是个可学习的参数,所以训练学习,前向计算固定,和weight一样。
3. 训练阶段使用eval固定BN,和去除BN无区别。当然在蒸馏的时候,大模型固定,小模型不固定。
解决 无用评论 打赏 举报
悬赏问题
- ¥15 #MATLAB仿真#车辆换道路径规划
- ¥15 java 操作 elasticsearch 8.1 实现 索引的重建
- ¥15 数据可视化Python
- ¥15 要给毕业设计添加扫码登录的功能!!有偿
- ¥15 kafka 分区副本增加会导致消息丢失或者不可用吗?
- ¥15 微信公众号自制会员卡没有收款渠道啊
- ¥100 Jenkins自动化部署—悬赏100元
- ¥15 关于#python#的问题:求帮写python代码
- ¥20 MATLAB画图图形出现上下震荡的线条
- ¥15 关于#windows#的问题:怎么用WIN 11系统的电脑 克隆WIN NT3.51-4.0系统的硬盘