为什么逻辑回归结果会和autogluon一摸一样啊

我用了逻辑回归与AutoGluon两个方法构架评分卡，按理说AutoGluon构建的模型roc_auc要更好啊，但是结果确是，他俩输出的结果一模一样，为什么会一模一样啊？

Xtr_woe = data_tr_woe.drop(['isDefault','type'],axis=1)
Ytr_woe = data_tr_woe['isDefault']
Xts_woe = data_ts_woe.drop(['isDefault','type'],axis=1)
Yts_woe = data_ts_woe['isDefault']
from sklearn.linear_model import LogisticRegression
lr = LogisticRegression()
lr.fit(Xtr_woe,Ytr_woe)
from toad.metrics import KS, F1, AUC

EYtr_proba = lr.predict_proba(Xtr_woe)[:,1]
EYtr = lr.predict(Xtr_woe)


print('Training error')
print('KS:', KS(EYtr_proba,Ytr_woe))
print('AUC:', AUC(EYtr_proba,Ytr_woe))

EYts_proba = lr.predict_proba(Xts_woe)[:,1]
EYts = lr.predict(Xts_woe)

print('\nTest error')
print('KS:', KS(EYts_proba,Yts_woe))
print('AUC:', AUC(EYts_proba,Yts_woe))

这是逻辑回归的代码，我一个参数都没调

import autogluon
from autogluon.tabular import TabularDataset,TabularPredictor  
import pandas as pd
import numpy as np
label='isDefault'
train_data=TabularDataset(data_tr_woe.drop(["type"],axis=1)  )
metric = 'roc_auc'
predictor=TabularPredictor(label=label,eval_metric=metric).fit(train_data,presets='best_quality')
best=predictor.get_model_best()
print(best)
test_data=TabularDataset(data_ts_woe.drop(['isDefault','type'],axis=1))
auto_proba=predictor.predict_proba(test_data)
auto_proba = np.array(EYts_proba).flatten() 
print(auto_proba )
print(len(auto_proba ))
print('\nTest error')
print('KS:', KS(auto_proba,Yts_woe))
print('AUC:', AUC(auto_proba,Yts_woe))

这是auto的代码，他俩输出的proba一模一样，我要崩溃了

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

9条回答默认最新

DEMAXIYAZHENGYI 2023-03-05 14:20

关注


import autogluon
from autogluon.tabular import TabularDataset,TabularPredictor  
import pandas as pd
import numpy as np
label='isDefault'
train_data=TabularDataset(data_tr_woe.drop(["type"],axis=1)  )
metric = 'roc_auc'
predictor=TabularPredictor(label=label,eval_metric=metric).fit(train_data,presets='best_quality',auto_stack=True)
test_data=TabularDataset(data_ts_woe.drop(['isDefault','type'],axis=1))
predictor.predict_proba(test_data)
auto_proba=predictor.predict_proba(test_data)
auto_proba=auto_proba.values[:,1]
auto_proba
auto_proba = np.array(auto_proba).flatten() 
print(auto_proba )
print(len(auto_proba ))
print('Training error')
print('KS:', KS(train_proba,Ytr_woe))
print('AUC:', AUC(train_proba,Ytr_woe))




print('\nTest error')
print('KS:', KS(auto_proba,Yts_woe))
print('AUC:', AUC(auto_proba,Yts_woe))

直接复制粘贴我给的，出结果，就是变量赋予错误了。

本回答被题主选为最佳回答 , 对您是否有帮助呢?

查看更多回答(8条)

报告相同问题？

关注问题

为什么逻辑回归结果会和autogluon一摸一样啊 python 机器学习逻辑回归
2023-03-03 10:58

回答 9 已采纳 import autogluon from autogluon.tabular import TabularDataset,TabularPredictor import pandas as p
为什么逻辑回归使用WOE建模数据挖掘机器学习逻辑回归
2022-11-10 21:33

回答 1 已采纳第一，好解释，因为如果dummy的话其实是将一个变量拆开了，会出现某个维度有一部分入模的情况，而woe不会；第二是变量变少了，调整更直观（这个好有道理）；第三是woe值可以很好的区分哪些组是负向的，
逻辑回归中的sigmoid函数为什么可以用来表示概率 python 分类回归有问必答
2022-06-08 21:52

回答 2 已采纳 sigmoid函数是一个常用的激活函数，它的表达式为它的图像为它可以把输入的连续实值转换为0到1之间的数字并输出，有两条渐近线分别为0和1，而此处0到1就表示分类的概率，它负责将神经元的输入映射
AutoGluon：亚马逊自动机器学习工具，初学者的福音
2023-11-10 12:10

人工智能大讲堂的博客 AutoGluon：亚马逊自动机器学习工具，初学者的福音
Python做出了逻辑回归模型，然后怎么带入一个自变量，得到对应因变量的值 python 逻辑回归
2022-01-31 13:46

回答 1 已采纳把公式提取出来就可以了。代码给你： from sklearn.datasets import load_breast_cancer from sklearn.linear_model import L
gcc 编译器和clang编译器输出结果为什么不一样？ c++ c语言
2022-09-26 11:45

回答 3 已采纳 c语言中，变量定义时是不自动初始化的而在c++中，变量定义时是自动初始化的而c和c++很多语法是兼容的所以你用不同的IDE来编译相同的代码，有时就正确，有时就错误还有，既然a是随机值，如果它随机到的值
Python做逻辑回归模型，y_test和y_pred_test是什么含义 python 逻辑回归
2022-01-30 22:13

回答 2 已采纳做逻辑回归，最好把样本集合(xSample, ySample) 分为训练样本集(xTrain, yTrain) 与检验样本集(xTest,yTest)，以免出现过拟合。由于模型是由 xTrain
算法工程师之超实用技术路线图
2020-09-02 08:30

Sim1480的博客对于不同级别的算法工程师技能要求，我们大致可以分成以下几个层级：初级：可以在一些指导和协助下独立完成开发任务。具体到算法方面，需要你对于工具框架，建模技术，业务特性等方面有一定的了解，可...
用这个算逻辑回归准确率为什么是0啊，正确的怎么写啊？ python
2022-05-31 19:46

回答 1 已采纳害，第一个问题，你这个data3赋值的时候就有错了，应该把data改成data1不是吗，明明是两个不同的数据；第二个问题也是最关键的问题，你的预测的data1类型是int64，和你的credibili
一个简单的日期，两种代码逻辑一样的，为什么最终结果相差一。 c++
2023-02-21 15:16

回答 1 已采纳你的代码逻辑有问题第一段代码是在moth==13才计算闰月，所以第一年他没有计算，第二段代码是每次循环都要计算闰月，所以正确
自动机器学习算法引入逻辑回归 python 机器学习逻辑回归
2023-03-12 09:23

回答 11 已采纳 import sklearn from sklearn import set_config from sklearn.pipeline import Pipeline from sklearn.im
重磅！2020 年算法工程师技术路线图
2021-06-23 18:28

Tom Hardy的博客点击上方“计算机视觉工坊”，选择“星标”干货第一时间送达作者丨字节@知乎来源丨https://zhuanlan.zhihu.com/p/192633890编辑 | 极市平台算法工程师如何获...
matlab逻辑回归logistic regression 数据类型问题 matlab 逻辑回归
2021-10-31 15:19

回答 1 已采纳你好同学，你的分类数据最好转换成分类向量，比如说男女转换成男1 0女0 1这种，如果仅有男女作为标签，那么建议最后标签设置就是10（分别代表男女）也是很不错的有帮助望采纳呢
难顶！大佬给的算法工程师技能树参考！
2021-03-25 00:42

机器学习与AI生成创作的博客在实际运作过程中，会碰到不少相关的问题，例如为什么程序报了资源不足的错误，为什么notebook在浏览器里打不开，为什么进程hang住了没有响应等等，都需要一些操作系统的知识来帮助理解和分析问题，最终排查解决。...
听听阿里老哥对算法工程师技术学习路线的建议
2020-09-23 11:50

深度学习技术前沿的博客在实际运作过程中，会碰到不少相关的问题，例如为什么程序报了资源不足的错误，为什么notebook在浏览器里打不开，为什么进程hang住了没有响应等等，都需要一些操作系统的知识来帮助理解和分析问题，最终排查解决。...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 3月13日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 3月5日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
赞助了问题酬金15元 3月3日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 3月3日

悬赏问题

¥15 微信会员卡等级和折扣规则
¥15 微信公众平台自制会员卡可以通过收款码收款码收款进行自动积分吗
¥15 随身WiFi网络灯亮但是没有网络，如何解决？
¥15 gdf格式的脑电数据如何处理matlab
¥20 重新写的代码替换了之后运行hbuliderx就这样了
¥100 监控抖音用户作品更新可以微信公众号提醒
¥15 UE5 如何可以不渲染HDRIBackdrop背景
¥70 2048小游戏毕设项目
¥20 mysql架构，按照姓名分表
¥15 MATLAB实现区间[a,b]上的Gauss-Legendre积分

为什么逻辑回归结果会和autogluon一摸一样啊

9条回答 默认 最新

问题事件

悬赏问题

9条回答默认最新