正在努力的大可爱 2018-12-18 14:57 采纳率: 100%
浏览 2812
已采纳

数据挖掘分类中关于分类器评估度量的一道题

数据元组已经按分类器返回概率值的递减序排序。对于每个元组,计算真正例 (TP)、假正例(FP)、真负例(TN)和假负例(FN)的个数。计算真正例 率(TPR)和假正例率(FPR)。

图片贴不出来,大概就是有十个元组,元组的类是N或者P,还有概率。
比如元组1的类是P,概率是0.95,元组2的类是N,概率是0.85等等递减排列。

我想问的是题目所说的“分类器返回概率值”指的是什么?是贝叶斯方法中的后验概率吗?
如果是的话TP、FP等是怎么根据后验概率算出来的?
如果不是的话那个概率是什么?TP、FP等是怎么算出来的?

  • 写回答

1条回答

  • 正在努力的大可爱 2018-12-18 07:38
    关注

    由图可知正元组有5个,负元组有5个,所以P=5,N=5。
    (1)由元组1开始,该元组具有最高的概率得分,取该得分为阈值,即t=0.95,这样,分类器认为大于等于t的为正元组,故元组1为正,而其他元组为负。由于元组1的实际类标号为正,所以有一个真实例。因此TP=1,FP=0,TN=5,FN=4。可以计算TPR=TP/P=1/5=0.2,FPR=0。
    (2)然后设置元组2的概率值0.85为阈值,因而此时元组1与元组2为正,而元组3~元组10被视作负。元组2的实际类标号为负,所以它是一个假正例。因此,TP=1,FP=1,TN=4,FN=4.可以计算TPR=TP/P=1/5=0.2,FPR=1/5=0.2。
    (3)以此类推,可计算出每个元组的TP、FP、TN、FN、TPR、FPR。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

悬赏问题

  • ¥15 MATLAB动图的问题
  • ¥15 求差集那个函数有问题,有无佬可以解决
  • ¥15 【提问】基于Invest的水源涵养
  • ¥20 微信网友居然可以通过vx号找到我绑的手机号
  • ¥15 寻一个支付宝扫码远程授权登录的软件助手app
  • ¥15 解riccati方程组
  • ¥15 display:none;样式在嵌套结构中的已设置了display样式的元素上不起作用?
  • ¥15 使用rabbitMQ 消息队列作为url源进行多线程爬取时,总有几个url没有处理的问题。
  • ¥15 Ubuntu在安装序列比对软件STAR时出现报错如何解决
  • ¥50 树莓派安卓APK系统签名