toad评分卡构建与改写问题

我用toad包构建了一个评分卡模型，我想对他进行改造，我把里面用的逻辑回归模型换成了别的模型，但是我发现不管我运不运行这个a模型，toad都可以直接出一个评分卡结果，难道我这个改写是错误的吗？toad是内置的逻辑回归，我是没法简单改写吗？



import pandas as pd
train=pd.read_csv("训练集.csv",index_col=0)
test=pd.read_csv("测试集.csv",index_col=0)

Xtr=train.loc[:,"ficoRangeLow":"n14"]
Ytr=train.loc[:,"isDefault"]

Xts=test.loc[:,"ficoRangeLow":"n14"]
Yts=test.loc[:,"isDefault"]


data_tr = pd.concat([Xtr,Ytr],axis=1)
data_tr['type'] = 'train'

data_ts = pd.concat([Xts,Yts],axis=1)
data_ts['type'] = 'test'
import toad
toad.detector.detect(data_tr).columns
toad.detector.detect(data_tr)

quality = toad.quality(data_tr,'isDefault',iv_only=True)
quality.sort_values('iv',ascending=False)


selected_data, dropped = toad.selection.select(data_tr,target = 'isDefault', empty = 0.5, iv = 0.02, corr = 0.9, return_drop=True,exclude=['type'])
print(dropped)
print(selected_data.shape)



quality = toad.quality(selected_data,'isDefault',iv_only=True)
quality.sort_values('iv',ascending=False)



ivzhi=quality.sort_values('iv',ascending=False)
ivzhi.to_csv("iv值排序.csv")


combiner = toad.transform.Combiner()
combiner.fit(selected_data, y = 'isDefault', method = 'chi', min_samples = 0.05) #empty_separate = False


from toad.plot import bin_plot
for i in range(0,14,1):
    col = selected_data.columns[i]
    bin_plot(combiner.transform(selected_data[[col,'isDefault']], labels=True), x=col, target='isDefault')


bins = combiner.export()
selected_test = data_ts[selected_data.columns]
combiner.set_rules(bins)
binned_data = combiner.transform(selected_data)
transer = toad.transform.WOETransformer()
data_tr_woe = transer.fit_transform(binned_data, binned_data['isDefault'], exclude=['isDefault','type'])
data_ts_woe = transer.transform(combiner.transform(selected_test))
Xtr_woe = data_tr_woe.drop(['isDefault','type'],axis=1)
Ytr_woe = data_tr_woe['isDefault']
Xts_woe = data_ts_woe.drop(['isDefault','type'],axis=1)
Yts_woe = data_ts_woe['isDefault']

import autogluon
from autogluon.tabular import TabularDataset,TabularPredictor  
import pandas as pd
import numpy as np
label='isDefault'
train_data=TabularDataset(data_tr_woe.drop(["type"],axis=1)  )
metric = 'roc_auc'
time_limit=60
predictor=TabularPredictor(label=label,eval_metric=metric).fit(train_data,presets='best_quality',time_limit=time_limit,auto_stack=True)

test_data=TabularDataset(data_ts_woe.drop(['isDefault','type'],axis=1))

predictor.predict_proba(train_data)
train_proba=predictor.predict_proba(train_data)
train_proba=train_proba.values[:,1]
train_proba = np.array(train_proba).flatten() 

predictor.predict_proba(test_data)
auto_proba=predictor.predict_proba(test_data)
auto_proba=auto_proba.values[:,1]
auto_proba = np.array(auto_proba).flatten() 

psi = toad.metrics.PSI(data_tr_woe,data_ts_woe)
psi.sort_values(0,ascending=False)

psizhi=psi.sort_values(0,ascending=False)
psizhi.to_csv("psi值.csv")


tr_bucket = toad.metrics.KS_bucket(train_proba,Ytr,bucket=10,method='quantile')
tr_bucket


selected_data
x_card=selected_data.loc[:,"ficoRangeLow":"n14"]
y_card=selected_data.loc[:,"isDefault"]

card = ScoreCard(combiner=combiner, 
                 transer=transer, 
                 C=0.1, 
                 class_weight='balanced', 
                 base_score=600,
                 base_odds=1,
                 pdo=50,
                 rate=2)
 
# 使用评分卡模型进行拟合
card.fit(x_card,y_card)

最后评分卡生成的这一步和我上面调试的模型没有任何关系，请问该如何改写才能让评分卡的构建基于我的模型。

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

9条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
mydmomo 2023-03-10 14:31
关注
toad对于模型的改造收不容易的，因为逻辑回归模型才带.coef_,你必须得根据线性模型才能应用于评分卡。你可以结合以下逻辑回归模型与自动机器学习，这样容易改。

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(8条)

报告相同问题？

关注问题

toad评分卡构建与改写问题 python 人工智能机器学习
2023-03-06 21:31

回答 9 已采纳 toad对于模型的改造收不容易的，因为逻辑回归模型才带.coef_,你必须得根据线性模型才能应用于评分卡。你可以结合以下逻辑回归模型与自动机器学习，这样容易改。
toad评分卡模型构建问题 python 机器学习
2023-03-06 21:10

回答 2 已采纳小魔女参考了bing和GPT部分内容调写:在构建评分卡模型时，需要引入逻辑回归模型，它主要是用来预测违约概率。逻辑回归模型是一种分类模型，它可以根据输入的特征，预测出一个类别标签，例如违约或不违约。在
scorecardpy的模型改写问题 python 开发语言机器学习
2023-03-07 16:36

回答 6 已采纳目前来看难度较大，socrecardpy只能应用线性模型，你可以试试xgb回归与sgd回归，必须带有.coef_指令的模型
使用toad库进行机器学习评分卡全流程
2023-08-03 11:26

AIGC人工智残的博客如逆向模型训练集KS值明显小于正向模型训练集KS值，说明当前时间外样本分布与开发样本差异较大，需要重新划分样本集。我们能看到前3箱出现上下波动，与整体的单调递减趋势不符，所以进行分箱合并。绘制Bivar图，观察...
toad for oracle代码运行显示用户不存在，如何解决？ oracle sql
2022-10-07 20:28

回答 1 已采纳没有这个VTTPC用户吧,你是不是用的SCOTT么
求toad for db2的一些快捷操作
2017-03-02 12:51

回答 1 已采纳参考：http://www.cr173.com/html/45761_1.html
相同语句使用黑窗cmd与Navicat查字符串长度结果不一致是怎么回事？ mysql
2019-01-27 10:25

回答 1 已采纳在cmd执行查询的时候将字符集设置为utf-8，否则中文不识别，一个中文当作2个字符了。
Toad：基于 Python 的标准化评分卡模型
2021-07-31 18:34

Python数据科学的博客大家好，我是东哥。在信贷的风控模型中最常用、最经典的可能要属评分卡了，所谓评分卡...本次和大家分享一个开源的评分卡神器toad。从数据探索、特征分箱、特征筛选、特征WOE变换、建模、模型评估、转换分数，都做了完
数据库连接的怪异问题，求教。
2010-06-18 08:47

回答 2 已采纳你试着换个端口试下．6789,50000 没往下执行，估计是你的驱动，没注册起来
mysql远程链接问题 mysql 数据库
2011-01-26 01:55

回答 2 已采纳 1.把my.cnf中的bind-address注释掉，然后重新启动mysql服务器程序sudo /etc/init.d/mysql restart。 2.检查下用户名密码及远程主机是否对你的IP
mySql @ variables与不同的客户端的行为不同 mysql php sql
2011-10-06 12:09

回答 1 已采纳 You should reset all variables (@ROWNUM and @PREV_CAT_ID) every time. Try this query - SELECT
risk库scorecard-report(自动化评分卡开发)工具输出报告
2023-09-07 14:45

该附件为python包risk库中自动化评分卡开发工具最终输出报告演示，以便参考！首页为目录，可自动跳转至所需的sheet页，且每个sheet亦有返回目录跳转。覆盖了评分卡开发的各个环节。本次建模以德国信贷数据作为数据...
如何使用Go的text / template包返回数组中的唯一元素？
2014-11-11 21:29

回答 2 已采纳 You can create your own functions for the template via template.FuncMap: arr := []string{ "mi
基于Toad的评分卡模型全流程详解（内含代码）
2022-10-12 17:18

金科应用研院的博客至此，我们就用toad快速完成了一个评分卡模型的全流程，可以说是非常方便了，没有使用太多第三方库，除了基本的numpy，pandas就只用到了toad和一点点sklearn，这也可以看出toad确实将评分卡的全流程都进行了完整的...
Toad：一款基于 Python 的开源评分卡神器
2022-05-02 11:57

我爱Python数据挖掘的博客在信贷的风控模型中最常用、最经典的可能要属评分卡了，所谓评分卡...今天我给大家分享一个开源的评分卡神器toad。从数据探索、特征分箱、特征筛选、特征WOE变换、建模、模型评估、转换分数，都做了完美的包装，可以
使用toad做一张逻辑回归贷前评分卡
2022-10-27 15:43

爱挠静香的下巴的博客基于toad做一张逻辑回归评分卡
逻辑回归评分卡实战-toad
2022-01-29 17:53

nikita_zj的博客逻辑回归评分卡实战-toad
toad建立评分卡
2020-07-21 17:52

椰风风风档不住的博客尝试用toad建评分卡 import pandas as pd import numpy as np import toad from toad.plot import bin_plot from toad.plot import badrate_plot from sklearn.model_selection import train_test_split from ...
风控模型A卡申请评分卡，toad包实例
2023-02-25 13:07

pmzqpmh的博客根据客户的信贷数据，使用toad包建立申请评分卡。
数据分析建模之逻辑回归(Logistic Regression)-使用toad进行评分卡建模详细步骤
2022-12-13 14:55

江湖人称桂某人的博客逻辑回归与toad包评分卡模型建模，简单上手，功能强大，含可用源码。
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 3月18日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 3月10日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 3月8日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
赞助了问题酬金15元 3月6日
展开全部

悬赏问题

¥15 smptlib使用465端口发送邮件失败
¥200 总是报错，能帮助用python实现程序实现高斯正反算吗？有偿
¥15 对于squad数据集的基于bert模型的微调
¥15 为什么我运行这个网络会出现以下报错？CRNN神经网络
¥20 steam下载游戏占用内存
¥15 CST保存项目时失败
¥15 树莓派5怎么用camera module 3啊
¥20 java在应用程序里获取不到扬声器设备
¥15 echarts动画效果的问题，请帮我添加一个动画。不要机器人回答。
¥15 Attention is all you need 的代码运行

toad评分卡构建与改写问题

9条回答 默认 最新

问题事件

悬赏问题

9条回答默认最新