mydmomo 2023-03-03 10:58 采纳率: 90.9%
浏览 68
已结题

为什么逻辑回归结果会和autogluon一摸一样啊

我用了逻辑回归与AutoGluon两个方法构架评分卡,按理说AutoGluon构建的模型roc_auc要更好啊,但是结果确是,他俩输出的结果一模一样,为什么会一模一样啊?

Xtr_woe = data_tr_woe.drop(['isDefault','type'],axis=1)
Ytr_woe = data_tr_woe['isDefault']
Xts_woe = data_ts_woe.drop(['isDefault','type'],axis=1)
Yts_woe = data_ts_woe['isDefault']
from sklearn.linear_model import LogisticRegression
lr = LogisticRegression()
lr.fit(Xtr_woe,Ytr_woe)
from toad.metrics import KS, F1, AUC

EYtr_proba = lr.predict_proba(Xtr_woe)[:,1]
EYtr = lr.predict(Xtr_woe)


print('Training error')
print('KS:', KS(EYtr_proba,Ytr_woe))
print('AUC:', AUC(EYtr_proba,Ytr_woe))

EYts_proba = lr.predict_proba(Xts_woe)[:,1]
EYts = lr.predict(Xts_woe)

print('\nTest error')
print('KS:', KS(EYts_proba,Yts_woe))
print('AUC:', AUC(EYts_proba,Yts_woe))

这是逻辑回归的代码,我一个参数都没调

import autogluon
from autogluon.tabular import TabularDataset,TabularPredictor  
import pandas as pd
import numpy as np
label='isDefault'
train_data=TabularDataset(data_tr_woe.drop(["type"],axis=1)  )
metric = 'roc_auc'
predictor=TabularPredictor(label=label,eval_metric=metric).fit(train_data,presets='best_quality')
best=predictor.get_model_best()
print(best)
test_data=TabularDataset(data_ts_woe.drop(['isDefault','type'],axis=1))
auto_proba=predictor.predict_proba(test_data)
auto_proba = np.array(EYts_proba).flatten() 
print(auto_proba )
print(len(auto_proba ))
print('\nTest error')
print('KS:', KS(auto_proba,Yts_woe))
print('AUC:', AUC(auto_proba,Yts_woe))

这是auto的代码,他俩输出的proba一模一样,我要崩溃了

  • 写回答

9条回答 默认 最新

  • DEMAXIYAZHENGYI 2023-03-05 14:20
    关注
    
    import autogluon
    from autogluon.tabular import TabularDataset,TabularPredictor  
    import pandas as pd
    import numpy as np
    label='isDefault'
    train_data=TabularDataset(data_tr_woe.drop(["type"],axis=1)  )
    metric = 'roc_auc'
    predictor=TabularPredictor(label=label,eval_metric=metric).fit(train_data,presets='best_quality',auto_stack=True)
    test_data=TabularDataset(data_ts_woe.drop(['isDefault','type'],axis=1))
    predictor.predict_proba(test_data)
    auto_proba=predictor.predict_proba(test_data)
    auto_proba=auto_proba.values[:,1]
    auto_proba
    auto_proba = np.array(auto_proba).flatten() 
    print(auto_proba )
    print(len(auto_proba ))
    print('Training error')
    print('KS:', KS(train_proba,Ytr_woe))
    print('AUC:', AUC(train_proba,Ytr_woe))
    
    
    
    
    print('\nTest error')
    print('KS:', KS(auto_proba,Yts_woe))
    print('AUC:', AUC(auto_proba,Yts_woe))
    
    
    
    

    直接复制粘贴我给的,出结果,就是变量赋予错误了。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(8条)

报告相同问题?

问题事件

  • 系统已结题 3月13日
  • 已采纳回答 3月5日
  • 赞助了问题酬金15元 3月3日
  • 创建了问题 3月3日

悬赏问题

  • ¥15 微信会员卡等级和折扣规则
  • ¥15 微信公众平台自制会员卡可以通过收款码收款码收款进行自动积分吗
  • ¥15 随身WiFi网络灯亮但是没有网络,如何解决?
  • ¥15 gdf格式的脑电数据如何处理matlab
  • ¥20 重新写的代码替换了之后运行hbuliderx就这样了
  • ¥100 监控抖音用户作品更新可以微信公众号提醒
  • ¥15 UE5 如何可以不渲染HDRIBackdrop背景
  • ¥70 2048小游戏毕设项目
  • ¥20 mysql架构,按照姓名分表
  • ¥15 MATLAB实现区间[a,b]上的Gauss-Legendre积分