使用t检验评估ROC-AUC分数的统计显著性

请问这段代码为什么出错？
（两个分类器的auc在前面已经算出来过了）

from sklearn.model_selection import cross_val_score

from scipy import stats

roc_auc_scores_clf1 = 0.982

roc_auc_scores_clf2 = 0.986

# 使用假设检验方法（如t检验）评估ROC-AUC分数的统计显著性
t_stat, p_val = stats.ttest_rel(roc_auc_scores_clf1, roc_auc_scores_clf2)

# 打印统计显著性结果
print("T-statistic:", t_stat)
print("P-value:", p_val)

if p_val < 0.05:
    print("The difference in ROC-AUC scores is statistically significant.")
else:
    print("The difference in ROC-AUC scores is not statistically significant.")

输出结果：

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

6条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
阿里嘎多学长 2024-04-22 14:09
关注
以下内容由CHATGPT及阿里嘎多学长共同生成、有用望采纳：

问题概括

这个问题的目的是使用t检验来评估两个分类器的ROC-AUC分数是否有统计学上的显著差异。

问题出现原因

根据提供的图片内容，代码在执行t检验时遇到了两个问题：

RuntimeWarning: divide by zero encountered in divide - 这表明在执行除法操作时，除数为零，导致无法完成计算。
RuntimeWarning: invalid value encountered in scalar multiply - 这通常意味着在进行标量乘法时，遇到了无效的数值。

这些问题可能是由于roc_auc_scores_clf1和roc_auc_scores_clf2的样本大小不足以进行t检验，或者这些分数的计算本身存在问题。

问题解决方案

为了解决这个问题，我们需要确保：

roc_auc_scores_clf1和roc_auc_scores_clf2是两个独立的样本集，且每个样本集至少有两个以上的观测值。
确保在进行t检验之前，没有除以零的情况发生。

由于图片中的错误信息提示了除以零的问题，这可能是由于样本量太小导致的。在进行t检验之前，我们需要检查样本量是否足够。

提供示例

以下是修改后的代码示例，它首先检查样本量是否足够，然后进行t检验：

from sklearn.model_selection import cross_val_score from scipy import stats # 假设roc_auc_scores_clf1和roc_auc_scores_clf2是两个分类器的ROC-AUC分数列表 roc_auc_scores_clf1 = [0.982, ...] # 这里应填入实际的分数列表 roc_auc_scores_clf2 = [0.986, ...] # 这里应填入实际的分数列表 # 检查样本量是否足够 n_clf1 = len(roc_auc_scores_clf1) n_clf2 = len(roc_auc_scores_clf2) ddof_clf1 = n_clf1 - 1 ddof_clf2 = n_clf2 - 1 if n_clf1 >= 2 and n_clf2 >= 2: t_stat, p_val = stats.ttest_rel(roc_auc_scores_clf1, roc_auc_scores_clf2) print("T-statistic:", t_stat) print("P-value:", p_val) if p_val < 0.05: print("The difference in ROC-AUC scores is statistically significant.") else: print("The difference in ROC-AUC scores is not statistically significant.") else: print("Sample size is too small for t-test.")

示例代码运行方式

运行这段代码，你需要一个Python环境，其中安装了scikit-learn和scipy库。你可以使用Jupyter Notebook、Python脚本或者任何支持Python的IDE来运行这段代码。

示例代码预期运行结果

如果样本量足够，代码将输出T统计量、P值，并根据P值判断ROC-AUC分数的差异是否具有统计学上的显著性。如果样本量不足，将输出提示信息。

T-statistic: [具体的T统计量数值] P-value: [具体的P值数值] The difference in ROC-AUC scores is statistically significant./Not statistically significant.

或者，如果样本量不足：

Sample size is too small for t-test.
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报编辑记录

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(5条)

报告相同问题？

关注问题

ROC(AUC)的显著性检验
2022-09-15 13:48

医学和生信笔记的博客本文首发于公众号：医学和...今天说一说ROC(AUC)的比较。二分类资料的ROC比较可以通过pROC包实现的，使用其中roc.test()函数可实现两个ROC 的Delong检验。使用pROC包的aSAH数据，其中outcome列是结果变量，1代表Goo
SigmaPlot实战指南：如何精准绘制ROC曲线并解读AUC差异显著性
2025-10-14 03:19

h0i1j2k3l的博客本文提供了一份详细的SigmaPlot实战指南，手把手教你如何精准绘制ROC曲线并解读AUC差异的显著性。文章涵盖了从数据准备、核心分析操作到图形美化的完整流程，并重点阐述了如何利用SigmaPlot内置的统计功能进行AUC...
避开SigmaPlot绘图5大坑：从ROC曲线到AUC显著性分析的完整避坑指南
2025-07-31 03:46

rnn9storyteller的博客本文针对使用SigmaPlot进行ROC曲线与AUC分析时常见的五大陷阱，提供了完整的避坑指南。重点剖析了数据格式、AUC与P值解读、多指标比较、图形美化以及非‘大优指标’处理等核心痛点，并给出了具体的实战解决方案，...
显著性检测评估指标：EMD显著性分析
2024-11-18 10:47

aka卡贴人的博客简介：显著性检测是计算机视觉中的关键领域，它旨在模拟人类视觉系统，识别图像中最具吸引力的部分。本压缩包文件涵盖了显著性检测...其他评估指标还包括ROC曲线、AUC、Precision-Recall曲线和F-measure等。...
如何科学地评估和评判深度学习模型？
2019-10-22 17:01

芷若初荨的博客最近在考虑要发Paper，在模型的性能比较中，除了采用Precision/Recall的比较之外，为了进一步验证论文中的选择是存在可证明性的，因此考虑了使用F-test对多种模型算法进行统计显著性检验。常见的模型评估与方法误...
在分类任务中，显著性分析
2025-04-26 16:45

小小毛桃的博客三、分类器预测一致性检验（McNemar Test）• 小样本优先使用精确检验（如Fisher精确检验）• 多重比较需校正（Bonferroni或FDR）四、参数显著性分析（Logistic回归）• 完整实现需处理数据预处理和模型训练步骤。...
机器学习模型评估指标AUC详解：从理论到实践
2025-10-15 23:03

大千AI助手的博客 AUC的全称是ROC曲线下面积要理解AUC，首先需要了解ROC曲线。ROC曲线是以假正率（False Positive Rate, FPR）为横轴、真正率（True Positive Rate, TPR）为纵轴的二维曲线图。它展示了在不同分类阈值下，模型的分类...
Shapiro-Wilk检验是另一种常用的正态性检验方法
2025-03-03 13:37

MD Analysis的博客 Shapiro-Wilk检验是另一种常用的正态性检验方法，尤其适用于小样本数据（通常n在8到50之间）。Shapiro-Wilk检验的原假设是数据来自正态分布。
14、机器学习分类器性能评估与统计检验方法详解
2025-10-01 02:47

root9的博客本文详细介绍了机器学习中分类器性能评估的基本方法与统计显著性检验技术。内容涵盖AUC计算、单重与多重采样估计方法（如留出法、k折交叉验证、重复采样和自助法），并系统分析了不同场景下的统计检验方法，包括配对...
配对t检验的步骤与R实现
2025-04-17 09:30

MD Analysis的博客配对t检验结果显示，两组数据的均值差异为0.6752，t值为3.3627，自由度为9，p值为0.008354。由于p值小于0.05，说明两组数据的均值差异具有统计学显著性。其中，配对样本的均值差异为0.6752，这表明治疗后的抑郁量表...
R语言中的实现独立样本t检验
2025-10-05 09:57

MD Analysis的博客 t检验（T test），亦称...t检验主要用于判断两组样本均值是否存在显著差异，是研究人员在实际应用中最常用的统计检验方法之一。根据具体数据和假设条件，t检验可以分为独立样本t检验、配对样本t检验以及单样本t检验等。
模型效果评估指标（ROC、AUC/KS、Lift、PSI）
2020-12-17 22:56

Tao_666的博客 ROC/AUC
54、机器学习实验中的分类器性能评估与统计检验
2025-10-05 00:09

ik678901234的博客本文系统介绍了机器学习实验中分类器性能评估的多种方法，涵盖ROC曲线与AUC、信息检索中的精度与召回率、多类分类的混淆矩阵等性能测量指标。同时详细讲解了基于正态分布和t分布的区间估计与假设检验原理，并扩展到...
R语言中独立样本t检验的实施
2025-03-05 10:37

MD Analysis的博客 t检验（T test），亦称...t检验主要用于判断两组样本均值是否存在显著差异，是研究人员在实际应用中最常用的统计检验方法之一。根据具体数据和假设条件，t检验可以分为独立样本t检验、配对样本t检验以及单样本t检验等。
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 5月1日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 4月23日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 4月22日

使用t检验评估ROC-AUC分数的统计显著性

6条回答 默认 最新

问题概括

问题出现原因

问题解决方案

提供示例

示例代码运行方式

示例代码预期运行结果

问题事件

6条回答默认最新