奖励函数曲线出现下面这种情况是什么原因啊,超参数、批次大小什么的都调过,还是效果不佳。求指点
收起
【相关推荐】
如果验证误差比训练误差大得多,可能是因为模型过拟合了。 解决办法: (a)减少多项式的阶数:低阶多项式不容易过拟合。 (b)可以对模型进行正则化:在损失函数中添加L2惩罚(Ridge)或L1惩罚(Lasso)。这也会减少模型的自由度的阶数。 (c)可以尝试增加数据集的数量。
报告相同问题?