Nemenyi检验Python代码错误

对两个模型（逻辑回归和随机森林）在多个不平衡率的数据集中各个性能度量指标（训练集的acc、auc、precision、recall、f1已经得出具体数值）是否有显著差异性进行Nemenyi检验。
出现这个错误的原因是什么？以及该怎么解决？

acc_score_list1, roc_auc_list1, precision_score_list1, recall_score_list1, f1_score_list1 = [], [], [], [], []
acc_score_list2, roc_auc_list2, precision_score_list2, recall_score_list2, f1_score_list2 = [], [], [], [], []

lg = LogisticRegression(random_state=42)
rf = RandomForestClassifier(n_estimators=100, random_state=42)

skfolds = StratifiedKFold(n_splits=5, shuffle=True, random_state=42)
for train_index, test_index in skfolds.split(X, y):
    X_train = X.iloc[train_index]
    y_train = y.iloc[train_index]
    X_test = X.iloc[test_index]
    y_test = y.iloc[test_index]
    X_resampled, y_resampled = ros.fit_resample(X_train, y_train)
    
    lg.fit(X_resampled, y_resampled)
    y_pred1 = lg.predict(X_test)
    
    rf_classifier = rf.fit(X_resampled, y_resampled)
    y_pred2 = rf_classifier.predict(X_test)


    #lg
    y_score1 = lg.predict_proba(X_test)[:,1]
    fpr1, tpr1, threshold1 = roc_curve(y_test,y_score1)
    roc_auc1 = auc(fpr1,tpr1)
    acc_score1 = accuracy_score(y_test,y_pred1)
    precision_score1 = precision_score(y_test,y_pred1)
    recall_score1 = recall_score(y_test,y_pred1)
    f1_score1 = f1_score(y_test, y_pred1)
    
    acc_score_list1.append(acc_score1)
    precision_score_list1.append(precision_score1)
    recall_score_list1.append(recall_score1)
    f1_score_list1.append(f1_score1)
    roc_auc_list1.append(roc_auc1)

    #rf
    y_score2 = rf.predict_proba(X_test)[:,1]
    fpr2, tpr2, threshold2 = roc_curve(y_test,y_score2)
    roc_auc2 = auc(fpr2,tpr2)
    acc_score2 = accuracy_score(y_test,y_pred2)
    precision_score2 = precision_score(y_test,y_pred2)
    recall_score2 = recall_score(y_test,y_pred2)
    f1_score2 = f1_score(y_test, y_pred2)
    
    acc_score_list2.append(acc_score2)
    precision_score_list2.append(precision_score2)
    recall_score_list2.append(recall_score2)
    f1_score_list2.append(f1_score2)
    roc_auc_list2.append(roc_auc2)

acc_score_list = [acc_score_list1, acc_score_list2] # add to a single list
roc_auc_list = [roc_auc_list1, roc_auc_list2]
precision_score_list = [precision_score_list1, precision_score_list2]
recall_score_list = [recall_score_list1, recall_score_list2]
f1_score_list = [f1_score_list1, f1_score_list2]

from scipy.stats import rankdata
# 将性能度量指标存储为字典
performance_metrics = {
'Accuracy': [acc_score_list1, acc_score_list2],
'Precision': [precision_score_list1, precision_score_list2],
'Recall': [recall_score_list1, recall_score_list2],
'F1': [f1_score_list1, f1_score_list2],
'AUC': [roc_auc_list1, roc_auc_list2]
}
# 计算每个模型在每个指标上的平均排名
avg_ranks = {}
for metric, scores in performance_metrics.items():
    avg_ranks[metric] = [rankdata(score) for score in scores]
# 计算平均排名
avg_ranks_combined = {}
for metric, ranks in avg_ranks.items():
    avg_ranks_combined[metric] = np.mean(ranks, axis=0)
# 进行Nemenyi检验
from scikit_posthocs import posthoc_nemenyi
import pandas as pd
# 将平均排名转换为DataFrame
avg_ranks_df = pd.DataFrame(avg_ranks_combined)
# 进行Nemenyi检验
nemenyi_results = posthoc_nemenyi(avg_ranks_df)
       
# 打印检验结果
print("Nemenyi Test Results:")
print(nemenyi_results)

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

5条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
阿里嘎多学长 2024-04-24 13:35
关注
以下内容由CHATGPT及阿里嘎多学长共同生成、有用望采纳：

图片内容

图片中显示了一个Python代码执行时的错误信息，具体为：

ValueError Traceback (most recent call last) ... File ...scikit_posthocs.py:453, in posthoc_nemenyi(a, val_col, group_col, dist, sort) ... File ...scikit_posthocs.py:71, in _convert_to_df(a, val_col, group_col, val_id, group_id) ... ValueError: Specify correct column names using 'group_col' and 'val_col' args

问题概括

问题是在进行Nemenyi检验时，遇到了一个ValueError，提示需要使用正确的列名作为group_col和val_col参数。

问题出现原因

错误信息表明在调用posthoc_nemenyi函数时，传递给该函数的数据a没有包含正确的列名。这可能是因为在创建用于Nemenyi检验的DataFrame时，没有正确地指定用于分组和值的列。

问题解决方案

为了解决这个问题，我们需要确保在调用posthoc_nemenyi函数时，传递给它的DataFrame包含用于分组和值的列，并且这些列名需要通过group_col和val_col参数明确指定。

提供代码

以下是修改后的代码示例，它创建了一个包含正确列名的DataFrame，并进行了Nemenyi检验：

import pandas as pd from scipy.stats import rankdata from scikit_posthocs import posthoc_nemenyi # 假设 performance_metrics 是一个包含模型性能指标的字典 # 计算每个模型在每个指标上的平均排名 avg_ranks = {metric: [rankdata(scores[0] + scores[1]) for scores in scores_list] for metric, scores_list in performance_metrics.items()} # 计算平均排名 avg_ranks_combined = {metric: np.mean(ranks, axis=0) for metric, ranks in avg_ranks.items()} # 将平均排名转换为DataFrame，确保包含正确的列名 avg_ranks_df = pd.DataFrame({ 'Model': ['LogisticRegression'] * len(avg_ranks['Accuracy']) + ['RandomForestClassifier'] * len(avg_ranks['Accuracy']), 'Average Rank': list(avg_ranks['Accuracy']) + list(avg_ranks['Precision']) # 以此类推，添加所有指标的平均排名 }) # 进行Nemenyi检验，指定正确的列名 nemenyi_results = posthoc_nemenyi(avg_ranks_df, val_col='Average Rank', group_col='Model') # 打印检验结果 print("Nemenyi Test Results:") print(nemenyi_results)

示例代码运行方式

运行这段代码需要有Python环境，并且安装了pandas, numpy, scipy, scikit_posthocs等库。可以通过命令行或者IDE运行。

示例代码预期运行结果

如果代码正确执行，将不会抛出错误，并且会打印出Nemenyi检验的结果，包括各模型间是否有显著差异性的信息。结果的具体形式取决于posthoc_nemenyi函数的实现和返回值。
本回答被专家选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报编辑记录

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(4条)

报告相同问题？

关注问题

机器学习：Friedman检验与Nemenyi后续检验，Python实现
2020-10-01 20:29

fanstuck的博客本人大数据专业初入大三刚刚接触机器学习这一课程，教材是最典型的西瓜书，第一次作业当然就是利用本专业语言多功能python语言结合书内容尝试自己构建P-R曲线以及延伸指标曲线。当然初入一些算法和机器学习的一些库...
Friedman检验及后续Nemenyi检验可视化
2024-01-01 23:13

吾仄lo咚锵的博客给出对应计算的python代码： from scipy.stats import f def friedman(R, k, N): xf = 0 for i in range(len(R)): xf = xf + R[i] * R[i] xf = xf - k * (k + 1) * (k + 1) / 4 xf = xf * 12 * N / k / (k + 1) ff ...
python画弗里德曼（Friedman）检验和秩和检验（Nemenyi）检验图
2022-05-22 15:18

小怪兽会微笑的博客 python画弗里德曼（Friedman）检验和秩和检验（Nemenyi）检验图画好后效果图实现代码如下 import matplotlib.pyplot as plt #算法平均排名 _alg_=[1.405,2.643,2.786,2.167] y=[1,2,3,4]#alg1,alg2,alg3,alg4 ...
Friedman检验和Nemenyi检验，测试以及python实现
2019-08-06 21:11

catEyesL的博客同时对于学习算法的比较，我们一般需要在多个数据集上比较多个算法的性能，这里常常采用Friedman检验和Nemenyi检验来进行比较。 1.Friedman检验对于k个算法和N个数据集，首先得到每个算法在每个数据集上的测试...
Nemenyi检验算法——SAS
2018-02-05 23:49

Nemenyi检验的SAS实现，文档可以参考http://www.doc88.com/p-1495423620760.html
【西瓜书第二章】2.4.4 Friedman 检验和 Nemenyi 检验
2022-05-18 12:30

不菜不菜的博客边看代码边看书就好理解了 # 作者：要努力，努力，再努力 # 开发时间：2022/5/18 9:44 import numpy as np import matplotlib.pyplot as plt def Friedman(n, k, data_matrix): ''' Friedman 检验 :param n:...
Friedman检验和Nemenyi后续检验-python实现论文中p值计算与临界差异图的绘制
2023-10-12 21:01

淡写 ╮ 青春的博客 Friedman检验和Nemenyi后续检验是论文中最常用的显著性检验方法，两种方法的详细介绍见《机器学习》-西瓜书P42-P44。在本文中，将使用真实论文中的数据进行计算，并绘制出论文中常见的临界差异图（CD），如下图所示...
【python画临界图（CD图）】Friedman检验与Nemenyi后续检验
2022-05-27 21:04

kw-a的博客使用python绘制关于Friedman检验与Nemenyi后续检验的临界图。
C语言辅助Nemenyi法检验设计.pdf
2021-09-19 15:46

C语言辅助Nemenyi法检验设计.pdf
非参数检验——Wilcoxon 检验 & Friedman 检验与 Nemenyi 后续检验
2022-10-04 22:46

梁小憨憨的博客最近看论文，看到了Wilcoxon signed-rank test（符号秩检验），咱也不知道是个啥，就学习了一下，这里做一下笔记，方便以后查阅。
模型性能评估之 Friedman 检验与 Nemenyi 后续检验
2020-06-21 09:25

蕾欧娜等等的博客本篇博客介绍一种模型性能评估的方法：Friedman 检验与 Nemenyi 后续检验。该方法的特点是：可以进行多个算法的比较。下面看看具体的使用：具体使用 1. 计算序值假定我们用 D1D_1D1、D2D_2D2 、D3D_3D3 和 ...
wallis滤波 matlab,基于Matlab的Kruskal-Wallis和Nemenyi检验的界面实现
2021-03-17 05:18

戴剑松的博客基于Ｍａｔｌａｂ的Ｋｎｓｋａｌ—Ｗａｌｌｉｓ和Ｎｅｍｅｎｙｉ检验的界面实现第三军医大学西南医院药剂科(４０００３８)胡小刚陈剑鸿孙凤军刘耀夏培元△【提要】目的设计Ｋｎｌｓｋａｌ—ｗａｌｌｉｓ检验和...
统计检验问题:Friedman Test,Nemenyi test检验和Bonferroni-Dunn test检验
2023-02-19 14:23

白小沫的博客统计检验
nemenyi检验英文全称_2014 护理研究试题及答案
2021-01-17 14:17

翔宇情的博客 χ2检验 B.方差分析 C.配对t检验 D.两独立样本t检验 5.下列哪种现象会影响资料的有效性，尤其是评价项目实施后效果的评价性研究(分值：1分) A.蝴蝶效应 B.霍桑效应 C.共轭效应 D.免疫效应 6.Cronbach's α相关系数常...
基于Matlab的Kruskal-Wallis和Nemenyi检验的界面实现.zip
2021-10-17 04:19

基于Matlab的Kruskal-Wallis和Nemenyi检验的界面实现
显著性检验python
2020-12-16 14:42

a useful man的博客信用特征检验/模型稳健性检验的代码实现1.1 常用的检验实现1.1.1 ttest_ind1.1.2 曼-惠特尼U检验（Mann-Whitney U test）1.1.3 KS_检验1.1.4 非参数统计...
Python画图常见问题和代码目录
2023-02-18 19:05

小怪兽会微笑的博客 Python画图常见问题和代码目录
R语言非参数检验多重比较
2022-10-30 12:47

医学和生信笔记的博客，专注R语言在临床医学中的使用，R语言数据分析和可视化。之前介绍了多个样本均数的多重比较，今天说说kruskal-Wallis H检验后的多重比较，Friedman M检验后的多重比较。也是和课本对照着来，孙振球，徐勇勇《医学...
nemenyi检验英文全称_医学统计学专业术语中英文对照表.doc
2021-01-28 09:08

Gh0u1L5的博客 univariate 单变虽方差分析 univariate ANOVA 单侧概率或单尾概率 onc-tailcd probability 单侧检验 one-sided test 单纯随机抽样 simple random sampling 单独效应 simple effect 单向分类的方差分析 one-way ...
【Python・统计学】Kruskal-Wallis检验/H检验（原理及代码）
2024-04-28 21:02

TUTO_TUTO的博客自学笔记，分享给对统计学原理不太清楚但需要在论文中用到的小伙伴，欢迎大佬们补充或绕道。ps：本文不涉及公式讲解（文科生小白友好体质）～（部分定义等...数据实例以及Python代码】【4.多重比较（例：Dunn检验）】
没有解决我的问题, 去提问