m0_56864166 2021-09-05 23:26 采纳率: 0%
浏览 57
已结题

R语言-关于决策树处理不平衡数据的阈值

求教大家,目前有个数据是不平衡数据,预测申请贷款的顾客是否会延期还款,不会延期的有76%,延期的24%,因为申请阶段的,可用的特征很少,只有5个特征,而且这些特征的数据大部分比例也非常不平衡,比如是否进过黑名单,大部分都是没有。我用rpart的分类树得到的树只有一个node,把所有的数据都分成了不会延期,因为延期用户会产生50%的损失,所以错误分类延期用户这会导致产生巨大损失,有什么办法能调整类似阈值或者权重的参数吗?查了很多的教程,大部分都用的Python,实在不知道怎么用r实现。求大家的智慧!

  • 写回答

1条回答 默认 最新

  • 有问必答小助手 2021-09-07 09:57
    关注

    你好,我是有问必答小助手,非常抱歉,本次您提出的有问必答问题,技术专家团超时未为您做出解答


    本次提问扣除的有问必答次数,将会以问答VIP体验卡(1次有问必答机会、商城购买实体图书享受95折优惠)的形式为您补发到账户。


    因为有问必答VIP体验卡有效期仅有1天,您在需要使用的时候【私信】联系我,我会为您补发。

    评论

报告相同问题?

问题事件

  • 系统已结题 9月13日
  • 创建了问题 9月5日

悬赏问题

  • ¥35 平滑拟合曲线该如何生成
  • ¥100 c语言,请帮蒟蒻写一个题的范例作参考
  • ¥15 名为“Product”的列已属于此 DataTable
  • ¥15 安卓adb backup备份应用数据失败
  • ¥15 eclipse运行项目时遇到的问题
  • ¥15 关于#c##的问题:最近需要用CAT工具Trados进行一些开发
  • ¥15 南大pa1 小游戏没有界面,并且报了如下错误,尝试过换显卡驱动,但是好像不行
  • ¥15 没有证书,nginx怎么反向代理到只能接受https的公网网站
  • ¥50 成都蓉城足球俱乐部小程序抢票
  • ¥15 yolov7训练自己的数据集