严重的非平衡数据二分类问题 5C

数据挖掘中,利用机器学习算法解决二分类问题,数据样本分布极不平衡:
好样本和坏样本之间的比率高达500:1,
请问采用什么机器学习算法和数据采样方法,或者两者的可以解决这样的数据极不平衡问题?

1个回答

两个办法,一个是通过复制的方式扩展坏样本,凑到和好样本一样多
一个是修改损失函数,将坏样本识别为好样本(漏报)的权重远远大于误报(好样本识别为坏样本)的权重

Csdn user default icon
上传中...
上传图片
插入图片
抄袭、复制答案,以达到刷声望分或其他目的的行为,在CSDN问答是严格禁止的,一经发现立刻封号。是时候展现真正的技术了!
立即提问
相关内容推荐