SSD训练修改梯度下降法

在SSD的python执行文件ssd_pascal.py中有如下代码用于创建solver配置文件，
solver = caffe_pb2.SolverParameter(
train_net=train_net_file,
test_net=[test_net_file],
snapshot_prefix=snapshot_prefix,
**solver_param)
其中solver_param是一个字典，包含了训练一些超参数的设置，
solver_param = {
# Train parameters
'base_lr': base_lr,
'weight_decay': 0.0005,
'lr_policy': "multistep",
#'stepvalue': [80000, 100000, 120000],
'stepvalue': [80000,100000,120000],
'gamma': 0.1,
'momentum': 0.9,
'iter_size': iter_size,
#'max_iter': 120000,
#'snapshot': 80000,
'max_iter': 120000,
'snapshot': 10000,
'display': 10,
'average_loss': 10,
'type': "SGD",
'solver_mode': solver_mode,
'device_id': device_id,
'debug_info': False,
'snapshot_after_train': True,
# Test parameters
'test_iter': [test_iter],
#'test_interval': 10000,
'test_interval': 10000,
'eval_type': "detection",
'ap_version': "11point",
'test_initialization': False,
}
我把优化方法从SGD改为Adam，训练正常进行，但是明显不对，因为loss显示输出还是从sgd_layer.cpp中输出的，模型结果确实也不对。请问caffe_pb2.SolverParameter是在哪里定义，我想看看里面怎么调用这个参数

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
devmiao 2017-12-24 14:58
关注
http://blog.csdn.net/xierhacker/article/details/53261008

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

ssd网络训练loss下降但是精度提不上去_12分钟训练COCO模型！速度精度双提高
2020-11-28 21:33

weixin_39882271的博客【摘要】中科院自动化所图像与视频分析组提出一种基于周期性矩衰减优化的大规模目标检测快速训练方法。该方法在保持精度的前提下，充分利用大规模集群的计算优势，成功将目标检测任务的batch size扩大到1000以上，大...
英伟达SSD视觉算法模型训练、转换与部署
2024-06-06 16:36

科技人生的博客深度学习的训练和推理流程，是先采用高性能图形服务器使用深度学习框架来训练（Training）机器学习算法，研究大量的数据来学习一个特定的场景，完成后得到模型参数，再部署到终端执行机器学习推理（Inference），以...
SSD训练数据集流程（学习记录）
2022-09-14 21:50

道人兄的博客 SSD训练数据集流程（学习记录）
AI系统——梯度累积算法
2022-01-08 21:16

ZOMI酱的博客在深度学习训练的时候，数据的batch size...在GPU内存不变的情况下，模型越来越大，那么这就意味着数据的batch size智能缩小，这个时候，梯度累积（Gradient Accumulation）可以作为一种简单的解决方案来解决这个问题。
Python+AI -黑马- 人脸识别Python人工智能-9.4G网盘下载.txt
2024-11-30 12:02

第二部分“深度学习优化进阶”可能讲解了深度学习模型训练中的优化技术和算法，如梯度下降、学习率调整等，帮助学生深入理解和掌握深度学习模型的调优过程。第三部分“卷积神经网络”则专注于图像处理领域中非常重要...
ssd网络训练loss下降但是精度提不上去_12分钟训练COCO模型:自动化所提出矩衰减优化的目标检测快速训练方法...
2020-12-06 22:28

weixin_39710951的博客 CASIA解锁更多智能之美【摘要】中科院自动化所图像与视频分析组提出一种基于周期性矩衰减优化的大规模目标检测快速训练方法。该方法在保持精度的前提下，充分利用大规模集群的计算优势，成功将目标检测任务的batch ...
从零开始大模型开发与微调：梯度下降算法
2024-11-10 01:56

光子AI的博客《从零开始大模型开发与微调：梯度下降算法》关键词：大模型、梯度下降算法、预训练、微调、深度学习摘要：本文将从零开始，深入探讨大模型的开发与微调过程，重点关注
大规模训练中的梯度累积与混合精度实战：扩散模型训练效率优化路径解析
2025-07-01 09:56

观熵的博客梯度累积与混合精度训练是当前最具实效的两种优化路径。本文结合实际工程经验，深入剖析梯度累积（Gradient Accumulation）与自动混合精度（Automatic Mixed Precision, AMP）的底层原理、实现方法与调试技巧。基于 ...
ssd pytorch版手把手源码（包括模型、代码、和数据）
2020-04-30 09:10

优化器通常选用SGD（随机梯度下降），并且可能包含动量和权重衰减。 7. 模型评估与推理：完成训练后，可以使用测试集对模型进行评估，计算平均精度（mAP）等指标。对于实际应用，将训练好的模型部署到推理系统中，...
Tech Talk：浅谈AI技术在SSD控制器中的应用
2024-04-22 09:58

Union Memory忆联的博客最终得到模型的输入信息为磨损次数PE，上电保持时间T，目标page的所在的plane、block和wordline编号，以及采用读取得到数据最准确的读电压RL1~RL7，采用随机森林与MLP算法，分别进行AI训练。图2：包含n个决策树的...
人工智能算法面试大总结-总目录
2022-09-14 17:53

啥都生的博客说说梯度下降法算法步骤？说说你知道的优化函数？展开说说梯度下降、批次梯度下降、随机梯度下降？说说Batch的影响？说说批量梯度下降与随机梯度下降区别？说说哪些方法对梯度引入动量进行改进？说说哪些方法...
没有解决我的问题, 去提问

SSD训练修改梯度下降法

1条回答 默认 最新

1条回答默认最新