长飞哥 2017-12-18 02:46 采纳率: 50%
浏览 2010
已结题

SSD训练修改梯度下降法

在SSD的python执行文件ssd_pascal.py中有如下代码用于创建solver配置文件,
solver = caffe_pb2.SolverParameter(
train_net=train_net_file,
test_net=[test_net_file],
snapshot_prefix=snapshot_prefix,
**solver_param)
其中solver_param是一个字典,包含了训练一些超参数的设置,
solver_param = {
# Train parameters
'base_lr': base_lr,
'weight_decay': 0.0005,
'lr_policy': "multistep",
#'stepvalue': [80000, 100000, 120000],
'stepvalue': [80000,100000,120000],
'gamma': 0.1,
'momentum': 0.9,
'iter_size': iter_size,
#'max_iter': 120000,
#'snapshot': 80000,
'max_iter': 120000,
'snapshot': 10000,
'display': 10,
'average_loss': 10,
'type': "SGD",
'solver_mode': solver_mode,
'device_id': device_id,
'debug_info': False,
'snapshot_after_train': True,
# Test parameters
'test_iter': [test_iter],
#'test_interval': 10000,
'test_interval': 10000,
'eval_type': "detection",
'ap_version': "11point",
'test_initialization': False,
}
我把优化方法从SGD改为Adam,训练正常进行,但是明显不对,因为loss显示输出还是从sgd_layer.cpp中输出的,模型结果确实也不对。请问caffe_pb2.SolverParameter是在哪里定义,我想看看里面怎么调用这个参数

  • 写回答

1条回答 默认 最新

  • devmiao 2017-12-24 14:58
    关注
    评论

报告相同问题?

悬赏问题

  • ¥17 pro*C预编译“闪回查询”报错SCN不能识别
  • ¥15 微信会员卡接入微信支付商户号收款
  • ¥15 如何获取烟草零售终端数据
  • ¥15 数学建模招标中位数问题
  • ¥15 phython路径名过长报错 不知道什么问题
  • ¥15 深度学习中模型转换该怎么实现
  • ¥15 HLs设计手写数字识别程序编译通不过
  • ¥15 Stata外部命令安装问题求帮助!
  • ¥15 从键盘随机输入A-H中的一串字符串,用七段数码管方法进行绘制。提交代码及运行截图。
  • ¥15 TYPCE母转母,插入认方向