我有一个数据集,预测目标y的箱形图分布如下,采用随机抽样划分为训练集和测试集,分布如下,得到的模型效果很好。但是当我用这个模型预测其他数据(预测目标分布在总数据集箱形图箱体外)时,rmse误差很大,说明我的模型没有很好地学习到箱形图之外的数据,这个问题该怎么解决呢




我有一个数据集,预测目标y的箱形图分布如下,采用随机抽样划分为训练集和测试集,分布如下,得到的模型效果很好。但是当我用这个模型预测其他数据(预测目标分布在总数据集箱形图箱体外)时,rmse误差很大,说明我的模型没有很好地学习到箱形图之外的数据,这个问题该怎么解决呢




引自免费微信小程序:皆我百晓生。
尝试使用迁移学习或者集成方法,如Bagging或Boosting,以增强模型对新分布数据的泛化能力。