不平衡数据的分类问题 5C

在数据挖掘中,我采用机器学习算法解决二分类问题。数据极其不平衡,非平衡率(好样本:坏样本)高达1:500。请问采用什么机器学习算法和数据采样技术,或者两者的结合,可以解决这种数据极其非平衡的二分类问题,使得模型具有较高的召回率或f1值。

1个回答

两个办法,一个是通过复制的方式扩展坏样本,凑到和好样本一样多
一个是修改损失函数,将坏样本识别为好样本(漏报)的权重远远大于误报(好样本识别为坏样本)的权重

Csdn user default icon
上传中...
上传图片
插入图片
抄袭、复制答案,以达到刷声望分或其他目的的行为,在CSDN问答是严格禁止的,一经发现立刻封号。是时候展现真正的技术了!
立即提问