数据挖掘中,利用机器学习算法解决二分类问题,数据样本分布极不平衡:
好样本和坏样本之间的比率高达500:1,
请问采用什么机器学习算法和数据采样方法,或者两者的可以解决这样的数据极不平衡问题?
严重的非平衡数据二分类问题
- 写回答
- 好问题 0 提建议
- 追加酬金
- 关注问题
- 邀请回答
-
1条回答 默认 最新
- threenewbee 2019-10-16 09:03关注
两个办法,一个是通过复制的方式扩展坏样本,凑到和好样本一样多
一个是修改损失函数,将坏样本识别为好样本(漏报)的权重远远大于误报(好样本识别为坏样本)的权重解决 无用评论 打赏 举报
悬赏问题
- ¥15 关于#网络安全#的问题:求ensp的网络安全,不要步骤要完成版文件
- ¥15 可否在不同线程中调用封装数据库操作的类
- ¥20 使用Photon PUN2解决游戏得分同步的问题
- ¥15 微带串馈天线阵列每个阵元宽度计算
- ¥15 keil的map文件中Image component sizes各项意思
- ¥30 BC260Y用MQTT向阿里云发布主题消息一直错误
- ¥20 求个正点原子stm32f407开发版的贪吃蛇游戏
- ¥15 划分vlan后,链路不通了?
- ¥20 求各位懂行的人,注册表能不能看到usb使用得具体信息,干了什么,传输了什么数据
- ¥15 Vue3 大型图片数据拖动排序