xgboost二分类预测概率为什么二极化?

最近训练了一个xgboost二分类模型,训练用的是每个季度的一部分数据,每个季度的数据一样多。用训练完的模型测试第四季度的全部数据,得到的概率值是二极化的,这是为啥?我理解得到的应该概率是正态分布.....

3个回答

看你的激活函数,它是非线性的,所以可以让结果更偏向一边,这是故意为之,你不希望结果出来大部分都是0.5附近模棱两可的,对吧。

LDY201805
LeeGuoooo 我认为得到的概率应该在0.5到1之间,而不是集中在0.95附近。
10 个月之前 回复

我平时用这个预测并非都是在0.95附近。你可以看下你的特征,是否有个别特征重要性过高了

LDY201805
LeeGuoooo 我检查了特征重要性,没有很高的,最高0.17。
10 个月之前 回复
LDY201805
LeeGuoooo 好的,我再看看,谢谢你
10 个月之前 回复

是不是你的正负样本不均匀,负样本太少了,导致学出来的都是正样本的规律

立即提问
相关内容推荐