问题遇到的现象和发生背景
构建随机森林二分类模型,在计算AUC值和绘制ROC曲线过程中,发现交叉验证得到的AUC和roc_auc得到的AUC值相差很多
问题相关代码
# 方法1
cross_val_score(clf_rf,Xtest,Ytest,scoring="roc_auc",cv=5).mean()
# 方法2
clf_rf = RandomForestClassifier(n_estimators=i
#,class_weight="balanced"
,random_state=90
).fit(Xtrain,Ytrain
fpr1,tpr1,thres1 = metrics.roc_curve(Ytrain, clf_rf.predict_proba(Xtrain)[:,1])
roc_auc1 = metrics.auc(fpr1, tpr1)