傥子龙云 2019-10-15 23:32 采纳率: 20%
浏览 654
已结题

严重的非平衡数据二分类问题

数据挖掘中,利用机器学习算法解决二分类问题,数据样本分布极不平衡:
好样本和坏样本之间的比率高达500:1,
请问采用什么机器学习算法和数据采样方法,或者两者的可以解决这样的数据极不平衡问题?

  • 写回答

1条回答 默认 最新

  • threenewbee 2019-10-16 09:03
    关注

    两个办法,一个是通过复制的方式扩展坏样本,凑到和好样本一样多
    一个是修改损失函数,将坏样本识别为好样本(漏报)的权重远远大于误报(好样本识别为坏样本)的权重

    评论

报告相同问题?

悬赏问题

  • ¥15 关于#网络安全#的问题:求ensp的网络安全,不要步骤要完成版文件
  • ¥15 可否在不同线程中调用封装数据库操作的类
  • ¥20 使用Photon PUN2解决游戏得分同步的问题
  • ¥15 微带串馈天线阵列每个阵元宽度计算
  • ¥15 keil的map文件中Image component sizes各项意思
  • ¥30 BC260Y用MQTT向阿里云发布主题消息一直错误
  • ¥20 求个正点原子stm32f407开发版的贪吃蛇游戏
  • ¥15 划分vlan后,链路不通了?
  • ¥20 求各位懂行的人,注册表能不能看到usb使用得具体信息,干了什么,传输了什么数据
  • ¥15 Vue3 大型图片数据拖动排序