问题遇到的现象和发生背景
今天在做建模分析的时候,用到随机森林处理多分类问题,最后画出的ROC曲线很奇怪,想知道这是什么原因造成的。
问题相关代码
import numpy as np
from sklearn.metrics import multilabel_confusion_matrix
from sklearn.metrics import classification_report,roc_auc_score
pred_y_quant = rf.predict_proba(Xtest)
con = multilabel_confusion_matrix(Ytest,rf.predict(Xtest),labels=[1.0,2.0,3.0,4.0,5.0])
print(classification_report(Ytest,rf.predict(Xtest),labels=[1.0,2.0,3.0,4.0,5.0]))
# macro avg 0.52 0.40 0.42 4646 weighted avg 0.71 0.72 0.70 4646
#AUC
AUC = roc_auc_score(np.array(Ytest),np.array(pred_y_quant),multi_class='ovo')
print('AUC:',auc)
pred_y_score = []
for i in pred_y_quant:
pred_y_score.append(max(i))
#ROC
plt.figure()
lw = 2
plt.plot(np.array(Ytest),np.array(pred_y_score),color='darkorange',
lw=lw,label = 'randomforest')
plt.plot(color='navy', lw=lw, linestyle='--')
plt.xlim([0.0, 5.0])
#plt.ylim([0.0, 1.05])
plt.xlabel('False Positive Rate')
plt.ylabel('True Positive Rate')
plt.title('Receiver operating characteristic example')
plt.legend(loc="lower right")
plt.show()
运行结果及报错内容
我想要达到的结果
画出正确的ROC曲线