模型中有正样本及负样本,那么就会有tp、fp、tn、fn四种情况。那么绘制pr图时以下情况R值如何计算
例如有如下一组10个数据
第一列是编号,第二列是样本真实类别(p代表正样本n代表负样本),第三列是机器预测类别(Y代表预测为正样本,N代表预测为负样本)。第四列是置信度
1 p Y 0.99999
2 p Y 0.99999
3 p N 0.99993
4 n Y 0.99986
5 p N 0.99964
6 p Y 0.99955
7 n Y 0.68139
8 n Y 0.50961
根据pr曲线定义,当把前三个样本作为正例预测时,P=TP/(TP+FP)=2/(2+0),这点没有问题。那么R=TP/(TP+FN)=2/(2+3),还是将第三个正例预测为反例的数值也算为TP,因此R=3/(3+2)
请问到底该咋算呀,盼回复,不胜感激!