Nemenyi检验结果有疑问

请问这段代码哪里有错误吗？为什么最后得出的结果不对？（现实中lg和rf、clf的性能相差明显，而Nemenyi检验得出的结果是rf和clf性能相差有显著性，反而与lg性能相差无显著性）
代码如下：


# 初始化分类器
lg=LogisticRegression(random_state=42)
rf = RandomForestClassifier(n_estimators=100, random_state=42)
clf = DecisionTreeClassifier(random_state=42)
# 交叉验证
skfolds=StratifiedKFold(n_splits=5, shuffle=True, random_state=42)
# 性能指标列表
performance_scores = {
    'lg': {'accuracy': [], 'precision': [], 'recall': [], 'f1': [], 'auc': []},
    'rf': {'accuracy': [], 'precision': [], 'recall': [], 'f1': [], 'auc': []},
    'clf': {'accuracy': [], 'precision': [], 'recall': [], 'f1': [], 'auc': []}
}

# 交叉验证过程
for train_index, test_index in skfolds.split(X, y):
    X_train, X_test = X.iloc[train_index], X.iloc[test_index]
    y_train, y_test = y.iloc[train_index], y.iloc[test_index]
    
    # 随机过采样
    ros = RandomOverSampler(random_state=42)
    X_resampled, y_resampled = ros.fit_resample(X_train, y_train)
    
    # 逻辑回归模型训练和评估
    lg.fit(X_resampled, y_resampled)
    y_pred1 = lg.predict(X_test)
    y_score1 = lg.predict_proba(X_test)[:, 1]
    fpr1, tpr1, _ = metrics.roc_curve(y_test, y_score1)
    roc_auc1 = metrics.auc(fpr1, tpr1)
    
    performance_scores['lg']['accuracy'].append(accuracy_score(y_test, y_pred1))
    performance_scores['lg']['precision'].append(precision_score(y_test, y_pred1))
    performance_scores['lg']['recall'].append(recall_score(y_test, y_pred1))
    performance_scores['lg']['f1'].append(f1_score(y_test, y_pred1))
    performance_scores['lg']['auc'].append(roc_auc1)
    
    # 随机森林模型训练和评估
    rf.fit(X_resampled, y_resampled)
    y_pred2 = rf.predict(X_test)
    y_score2 = rf.predict_proba(X_test)[:, 1]
    fpr2, tpr2, _ = metrics.roc_curve(y_test, y_score2)
    roc_auc2 = metrics.auc(fpr2, tpr2)
    
    performance_scores['rf']['accuracy'].append(accuracy_score(y_test, y_pred2))
    performance_scores['rf']['precision'].append(precision_score(y_test, y_pred2))
    performance_scores['rf']['recall'].append(recall_score(y_test, y_pred2))
    performance_scores['rf']['f1'].append(f1_score(y_test, y_pred2))
    performance_scores['rf']['auc'].append(roc_auc2)
    
    # 决策树模型训练和评估
    clf.fit(X_resampled, y_resampled)
    y_pred3 = clf.predict(X_test)
    y_score3 = clf.predict_proba(X_test)[:, 1]
    fpr3, tpr3, _ = metrics.roc_curve(y_test, y_score3)
    roc_auc3 = metrics.auc(fpr3, tpr3)
    
    performance_scores['clf']['accuracy'].append(accuracy_score(y_test, y_pred3))
    performance_scores['clf']['precision'].append(precision_score(y_test, y_pred3))
    performance_scores['clf']['recall'].append(recall_score(y_test, y_pred3))
    performance_scores['clf']['f1'].append(f1_score(y_test, y_pred3))
    performance_scores['clf']['auc'].append(roc_auc3)

# 进行Nemenyi检验
for metric in performance_scores['lg']:
    # 将两个模型的该性能指标得分转换为数组
    scores_lg = np.array(performance_scores['lg'][metric])
    scores_rf = np.array(performance_scores['rf'][metric])
    scores_clf = np.array(performance_scores['clf'][metric])
    
    # 执行Friedman检验
    # 将数据存储在numpy数组中
    df = np.array([scores_lg, scores_rf, scores_clf])

    # 进行Friedman检验
    friedman_stat, p_value = friedmanchisquare(*df)

print("Friedman检验统计量:", friedman_stat)
print("Friedman检验P值:", p_value)

    
    # 如果Friedman检验显著，执行Nemenyi后验检验
    if p < 0.05:
        data = np.array([scores_lg, scores_rf, scores_clf])
        nemenyi_results = posthoc_nemenyi(data.T)
        print("Nemenyi后验检验结果:")
        print(nemenyi_results)
    else:
        print("Friedman检验结果不显著，无需进行Nemenyi后验检验")

# 如果Friedman检验显著，执行Nemenyi后验检验
results =sp.posthoc_nemenyi_friedman (df.T )
print(results)

检验结果：

lg模型性能：

rf模型性能：

clf模型性能：

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

5条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
专家-皆知 2024-04-30 16:57
关注
参考免费微信小程序：皆我百晓生 作答，经由专家-皆知整理回复，如问题解决，望采纳；如仍有疑问，请评论回复。

根据您提供的信息，您的目标是对三种分类器（逻辑回归lg、随机森林rf、决策树clf）的性能进行Nemenyi检验。首先，让我们纠正并补充您代码中的一些问题和遗漏部分，这可能解释了为何您的检验结果与预期不符。

Friedman检验后的条件判断错误：您在代码中没有正确设置p_value变量用于判断是否进行Nemenyi检验。正确的做法是在进行Friedman检验后立即定义p_value。

调用Nemenyi检验的库函数错误：您使用了sp.posthoc_nemenyi_friedman(df.T)，但没有导入正确的库或函数。通常，使用scipy.stats中的Friedman检验，但Nemenyi后验检验需要借助其他包，比如statsmodels.stats.multitest或特定的函数实现，但标准库中没有直接提供Nemenyi检验。您可能需要自定义Nemenyi检验的计算或使用第三方实现。

性能指标的选择：Nemenyi检验适用于多个模型的比较，您需要确保使用的性能指标是一致且合适的。您展示的最终结果似乎与中间过程不匹配，未直接展示Nemenyi检验的结果细节，但提到了不一致的性能表现。

下面是一个修正后的示例代码框架，注意，由于Python标准库不直接提供Nemenyi检验的函数，您可能需要使用或实现额外的逻辑来完成Nemenyi检验部分。这里仅提供修正Friedman检验部分的代码，并说明如何准备进行Nemenyi检验的逻辑。

from scipy.stats import friedmanchisquare import numpy as np # 假设这是您的性能分数收集部分，已省略 # 进行Friedman检验 for metric in performance_scores['lg']: scores_lg = np.array(performance_scores['lg'][metric]) scores_rf = np.array(performance_scores['rf'][metric]) scores_clf = np.array(performance_scores['clf'][metric]) df = np.array([scores_lg, scores_rf, scores_clf]) friedman_stat, p_value = friedmanchisquare(*df) print(f"Friedman检验统计量 for {metric}: {friedman_stat}") print(f"Friedman检验P值 for {metric}: {p_value}") # 正确判断进行Nemenyi检验的条件 if p_value < 0.05: # 注意：这里需要您自己实现或找到Nemenyi检验的代码，以下为概念说明 # nemenyi_results = perform_nemenyi_test(scores_lg, scores_rf, scores_clf) # 假设函数存在 # print("Nemenyi后验检验结果:", nemenyi_results) # 实际应用中，您需要实现或引用一个能执行Nemenyi检验的函数 pass else: print(f"对于{metric}，Friedman检验结果不显著，无需进行Nemenyi后验检验")

对于Nemenyi检验的具体实现，您可能需要查找或开发一个适合您需求的实现方式，因为标准库并不包含这个检验。此外，确保您收集的性能指标在统计上是可靠的，且样本量足够进行这样的假设检验。如果您需要Nemenyi检验的详细实现逻辑，可能需要查阅相关的统计学文献或寻找社区中分享的实现代码。
解决无用
评论打赏
分享
举报编辑记录

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

Nemenyi检验算法——SAS
2018-02-05 23:49

Nemenyi检验的SAS实现，文档可以参考http://www.doc88.com/p-1495423620760.html
机器学习之Nemenyi检验
2024-12-08 23:41

dundunmm的博客 Nemenyi检验是Friedman...Nemenyi检验是基于Friedman检验结果的多重比较方法。它是一种配对比较检验，通常用于多组数据间的成对比较。Nemenyi检验的核心是通过对所有可能的组对进行比较，检查它们之间的差异是否显著。
Friedman检验及后续Nemenyi检验可视化
2024-01-01 23:13

吾仄lo咚锵的博客如果原假设被拒绝，那么接下来Nemenyi后续检验就会被执行。比如对于7中方法，进行了5次实验，实验排名如下表所示：实验1 实验2 实验3 实验4 实验5 3 2 3 4 1 5 5 7 5 4 2 3 2 1 3 1 1 1 2 2 4 6 4 3 5 6 4 6 7 6 7...
Friedman检验和Nemenyi检验
2025-01-13 12:12

ZetaJy的博客 Friedman检验和Nemenyi检验的大致步骤
C语言辅助Nemenyi法检验设计.pdf
2021-09-19 15:46

当常规的统计软件（如SAS、SPSS、Stata）未提供Nemenyi法检验功能时，就需要借助编程语言来实现自动化计算。 C语言因其高效率、灵活性而成为实现该算法的常用工具。本文通过C语言编写的程序能够实现Nemenyi法的自动...
【西瓜书第二章】2.4.4 Friedman 检验和 Nemenyi 检验
2022-05-18 12:30

不菜不菜的博客边看代码边看书就好理解了 # 作者：要努力，努力，再努力 # 开发时间：2022/5/18 9:44 ... Friedman 检验 :param n:数据集个数 :param k: 算法种数 :param data_matrix:排序矩阵 :return:T1 ''' ..
模型性能评估之 Friedman 检验与 Nemenyi 后续检验
2020-06-21 09:25

蕾欧娜等等的博客本篇博客介绍一种模型性能评估的方法：Friedman 检验与 Nemenyi 后续检验。该方法的特点是：可以进行多个算法的比较。下面看看具体的使用：具体使用 1. 计算序值假定我们用 D1D_1D1、D2D_2D2 、D3D_3D3 和 ...
Friedman检验和Nemenyi检验，测试以及python实现
2019-08-06 21:11

catEyesL的博客同时对于学习算法的比较，我们一般需要在多个数据集上比较多个算法的性能，这里常常采用Friedman检验和Nemenyi检验来进行比较。 1.Friedman检验对于k个算法和N个数据集，首先得到每个算法在每个数据集上的测试...
基于Matlab的Kruskal-Wallis和Nemenyi检验的界面实现.zip
2021-10-17 04:19

如果Kruskal-Wallis检验结果显示存在总体中位数的差异，那么Nemenyi检验将提供一个临界距离（通常是Q值），用以判断具体哪些组对之间有显著差异。这个距离基于α显著性水平和样本数量，能帮助我们避免因为过多的比较...
python画弗里德曼（Friedman）检验和秩和检验（Nemenyi）检验图
2022-05-22 15:18

小怪兽会微笑的博客 python画弗里德曼（Friedman）检验和秩和检验（Nemenyi）检验图画好后效果图实现代码如下 import matplotlib.pyplot as plt #算法平均排名 _alg_=[1.405,2.643,2.786,2.167] y=[1,2,3,4]#alg1,alg2,alg3,alg4 ...
非参数检验——Wilcoxon 检验 & Friedman 检验与 Nemenyi 后续检验
2022-10-04 22:46

梁小憨憨的博客最近看论文，看到了Wilcoxon signed-rank test（符号秩检验），咱也不知道是个啥，就学习了一下，这里做一下笔记，方便以后查阅。
Nemenyi 检验CD图的绘制/AttributeError: module ‘Orange.evaluation.scoring‘ has no attribute ‘compute_CD‘
2025-07-09 20:44

白开水不加糖的博客 Nemenyi 后续检验的结果常常用CD图可视化出来。但我画CD图的时候遇到了很多问题，例如代码报错AttributeError: module 'Orange.evaluation.scoring' has no attribute 'compute_CD'。在参考了诸多大佬的解决方案后，...
Python 使用Orange 绘制Nemenyi test CD图
2024-08-07 18:30

深巷少年梦°的博客高版本的Orange不支持compute_cd 因此，只能试图降低Orange的版本，上一个笔记中说了安装Python Orange 安装-CSDN博客这里说一下怎么快速的用一个低版本的Orange实现Nemenyi test CD图的绘制： 1.在网站Orange Data...
nemenyi检验英文全称_2014 护理研究试题及答案
2021-01-17 14:17

翔宇情的博客科目：护理研究试卷名称：2014年1月护理研究正考满分：100一、单选题1.对于呈偏态分布的计量资料来说，用于描述其集中趋势...下列哪种访谈要求研究人员具备较强的会谈技巧和分析解释结果的能力，对于研究者的组织能...
统计检验问题:Friedman Test,Nemenyi test检验和Bonferroni-Dunn test检验
2023-02-19 14:23

白小沫的博客统计检验
R语言非参数检验多重比较
2022-10-30 12:47

医学和生信笔记的博客，专注R语言在临床医学中的使用，R语言数据分析和可视化。之前介绍了多个样本均数的多重比较，今天说说kruskal-Wallis H检验后的多重比较，Friedman M检验后的多重比较。也是和课本对照着来，孙振球，徐勇勇《医学...
机器学习：Friedman检验与Nemenyi后续检验，Python实现
2020-10-01 20:29

fanstuck的博客在此领域本人有诸多不明确疑问，可能文章会有些许错误，望大家在评论区指正，本篇文章错误将会不断更正维护。具体代码实现参考：https://blog.csdn.net/qqMiSa/article/details/98660515 提示：以下...
wallis滤波 matlab,基于Matlab的Kruskal-Wallis和Nemenyi检验的界面实现
2021-03-17 05:18

戴剑松的博客基于Ｍａｔｌａｂ的Ｋｎｓｋａｌ—Ｗａｌｌｉｓ和Ｎｅｍｅｎｙｉ检验的界面实现第三军医大学西南医院药剂科(４０００３８)胡小刚陈剑鸿孙凤军刘耀夏培元△【提要】目的设计Ｋｎｌｓｋａｌ—ｗａｌｌｉｓ检验和...
nemenyi检验英文全称_医学统计学专业术语中英文对照表.doc
2021-01-28 09:08

Gh0u1L5的博客 univariate 单变虽方差分析 univariate ANOVA 单侧概率或单尾概率 onc-tailcd probability 单侧检验 one-sided test 单纯随机抽样 simple random sampling 单独效应 simple effect 单向分类的方差分析 one-way ...
Friedman test以及后续检验Nemenyi test和Bonferroni-Dunn test
2020-11-23 12:22

jbb0523的博客在做算法对比时，往往需要对实验结果进行统计检验。Friedman test是一种常用的检验，用来比较k个算法在N个数据集上的整体表现性能。但Friedman test只能给出k个算法的性能之间是否存在差异，如果存在差异，还需要...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 4月30日

Nemenyi检验结果有疑问

5条回答 默认 最新

问题事件

5条回答默认最新