「神秘奇男子」 2023-02-23 16:07 采纳率: 87%
浏览 109
已结题

使用AdamW优化器的权重衰减大概设置成多少好

用swintransformer语义分割自己的数据集 使用Adamw优化器的话l2正则大概设置成多少比较好啊 训练集大概1万张224x224 感觉结果总是容易过拟合

  • 写回答

1条回答 默认 最新

  • yangkun314159 2023-02-24 20:38
    关注

    引用自chatgpt
    AdamW优化器是Adam优化器的一种变体,主要是为了解决Adam优化器可能会带来的权重衰减不准确的问题。因此,AdamW优化器已经包含了权重衰减(weight decay)的功能,因此不需要单独设置权重衰减的参数。

    对于L2正则化的参数设置,通常需要进行一定的实验来确定最优参数。一般来说,L2正则化的参数设置不应该太大,否则可能会抑制模型的性能。在实际操作中,可以先尝试一些常用的L2正则化参数值,例如0.001或0.0001,并通过训练集和验证集的性能来选择最优参数。

    针对您提到的语义分割问题,由于输入图像的分辨率较高(224x224),同时训练集中有1万张图像,因此可能需要使用更加复杂的模型来处理这些图像。此外,还可以尝试进行数据增强等操作,以提高模型的泛化能力和防止过拟合的问题。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

问题事件

  • 系统已结题 3月5日
  • 已采纳回答 2月25日
  • 创建了问题 2月23日

悬赏问题

  • ¥15 使用yolov5-7.0目标检测报错
  • ¥15 对于这个问题的解释说明
  • ¥200 询问:python实现大地主题正反算的程序设计,有偿
  • ¥15 smptlib使用465端口发送邮件失败
  • ¥200 总是报错,能帮助用python实现程序实现高斯正反算吗?有偿
  • ¥15 对于squad数据集的基于bert模型的微调
  • ¥15 为什么我运行这个网络会出现以下报错?CRNN神经网络
  • ¥20 steam下载游戏占用内存
  • ¥15 CST保存项目时失败
  • ¥20 java在应用程序里获取不到扬声器设备