weixin_43823859
正在努力的大可爱
采纳率100%
2018-12-18 14:57

数据挖掘分类中关于分类器评估度量的一道题

已采纳

数据元组已经按分类器返回概率值的递减序排序。对于每个元组,计算真正例 (TP)、假正例(FP)、真负例(TN)和假负例(FN)的个数。计算真正例 率(TPR)和假正例率(FPR)。

图片贴不出来,大概就是有十个元组,元组的类是N或者P,还有概率。
比如元组1的类是P,概率是0.95,元组2的类是N,概率是0.85等等递减排列。

我想问的是题目所说的“分类器返回概率值”指的是什么?是贝叶斯方法中的后验概率吗?
如果是的话TP、FP等是怎么根据后验概率算出来的?
如果不是的话那个概率是什么?TP、FP等是怎么算出来的?

  • 点赞
  • 写回答
  • 关注问题
  • 收藏
  • 复制链接分享
  • 邀请回答

1条回答

  • weixin_43823859 正在努力的大可爱 3年前

    由图可知正元组有5个,负元组有5个,所以P=5,N=5。
    (1)由元组1开始,该元组具有最高的概率得分,取该得分为阈值,即t=0.95,这样,分类器认为大于等于t的为正元组,故元组1为正,而其他元组为负。由于元组1的实际类标号为正,所以有一个真实例。因此TP=1,FP=0,TN=5,FN=4。可以计算TPR=TP/P=1/5=0.2,FPR=0。
    (2)然后设置元组2的概率值0.85为阈值,因而此时元组1与元组2为正,而元组3~元组10被视作负。元组2的实际类标号为负,所以它是一个假正例。因此,TP=1,FP=1,TN=4,FN=4.可以计算TPR=TP/P=1/5=0.2,FPR=1/5=0.2。
    (3)以此类推,可计算出每个元组的TP、FP、TN、FN、TPR、FPR。

    点赞 4 评论 复制链接分享

相关推荐