使用GradientBoostingRegressor时，在输出ACC，MCC等结果时遇到的问题

遇到的是我试图使用GradientBoostingRegressor算法，然后算出这个算法的ACC,MCC,Precision之类的数据，但是失败了。

遇到的报错主要是这个

raise ValueError("Classification metrics can't handle a mix of {0} "
ValueError: Classification metrics can't handle a mix of binary and continuous targets

代码块如下

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import random
from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score, matthews_corrcoef, auc, roc_curve, roc_auc_score
from sklearn.metrics import classification_report
from sklearn.metrics import confusion_matrix
from sklearn.metrics import cohen_kappa_score
from sklearn.metrics import roc_auc_score
from sklearn.model_selection import train_test_split
from pathlib import Path
from sklearn import ensemble
from sklearn import datasets
from sklearn.utils import shuffle
from sklearn.metrics import mean_squared_error
#叠上去的应用模块


df1=pd.read_csv('/root/data.csv',skip_blank_lines=True)
df1.dropna(inplace=True)
X=df1.drop(columns=["id","label"],axis=1)
Y=df1["label"]
X_train, X_test, Y_train, Y_test = train_test_split(X, Y, test_size=0.3, random_state=88)
#这是将数据库中的数据随机划分

params = {'n_estimators': 500, 'max_depth': 4, 'min_samples_split': 2,'learning_rate': 0.01, 'loss': 'ls'}
clf = ensemble.GradientBoostingRegressor(**params)
clf.fit(X_train, Y_train)
mse = mean_squared_error(Y_test, clf.predict(X_test))
#截至到这一步都是正常的，这个mse可以正常输出

############################下面这一块是我猜测出问题的重点
y_pred=clf.predict(X_test)
y_ture=Y_test
ACC=accuracy_score(y_ture,y_pred)
#报错就是出现在ACC这一行上面
############################

Precision=precision_score(y_ture,y_pred)
recall=recall_score(y_ture,y_pred)
F1_score=f1_score(y_ture,y_pred)
mcc=matthews_corrcoef(y_ture,y_pred)

print("ACC:",ACC)
print("MCC:",mcc)
print("Precision:",Precision)
print("f1_score:",F1_score)
print("recall:",recall)
print("MSE: %.4f" % mse)
#最后的输出部分

这是运行出来的结果和详细的报错内容

Traceback (most recent call last):
File "/root/two.py", line 42, in
ACC=accuracy_score(y_ture,y_pred)
File "/usr/local/lib/python3.10/dist-packages/sklearn/utils/validation.py", line 63, in inner_f
return f(*args, **kwargs)
File "/usr/local/lib/python3.10/dist-packages/sklearn/metrics/_classification.py", line 202, in accuracy_score
y_type, y_true, y_pred = _check_targets(y_true, y_pred)
File "/usr/local/lib/python3.10/dist-packages/sklearn/metrics/_classification.py", line 92, in _check_targets
raise ValueError("Classification metrics can't handle a mix of {0} "
ValueError: Classification metrics can't handle a mix of binary and continuous targets

我最开始尝试过

https://blog.csdn.net/qq_24211837/article/details/121012374?ops_request_misc=&request_id=&biz_id=102&utm_term=Classification%20metrics%20can%27t%20h&utm_medium=distribute.pc_search_result.none-task-blog-2~all~sobaiduweb~default-0-121012374.142^v71^js_top,201^v4^add_ask&spm=1018.2226.3001.4187
这个链接作者的三个方法，但是均有bug，不会修改

我想要达到的结果是可以正常输出ACC，以及之后的一系列数值

附：这是里面的数据
X_train,X_test,Y_train,Y_test如下
X train
protected followers_count ... notifications translator_type
8769 0 13 ... 0 0
8823 0 11 ... 0 0
7062 0 1643 ... 0 1
5628 0 23 ... 0 0
2493 0 15 ... 0 0
... ... ... ... ... ...
8555 0 10 ... 0 0
2482 0 4198 ... 0 0
4048 0 946 ... 0 0
6433 0 10 ... 0 0
10201 0 22 ... 0 0

[7449 rows x 19 columns]

X test
protected followers_count ... notifications translator_type
6541 0 588 ... 0 0
8253 0 32 ... 0 0
8534 0 1582 ... 0 0
8580 0 15 ... 0 0
10039 0 48727 ... 0 0
... ... ... ... ... ...
510 0 2 ... 0 0
4572 0 34 ... 0 0
814 0 10 ... 0 0
8699 0 54 ... 0 0
3469 0 18 ... 0 0

[3193 rows x 19 columns]

Y train
8769 1.0
8823 1.0
7062 0.0
5628 0.0
2493 1.0
...
8555 1.0
2482 1.0
4048 0.0
6433 1.0
10201 1.0
Name: label, Length: 7449, dtype: float64

Y test
6541 1.0
8253 1.0
8534 0.0
8580 1.0
10039 0.0
...
510 1.0
4572 1.0
814 0.0
8699 0.0
3469 1.0
Name: label, Length: 3193, dtype: float64

之前也用其它的代码刷过，没有空值或者无穷大什么的，是不是这里的数据和后面函数需求的行或列的要求不一样？

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

4条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
哇小侠 2023-01-19 00:24
关注
当使用 GradientBoostingRegressor 算法时，出现“Classification metrics can't handle a mix of binary and continuous targets”错误，是因为该算法是回归算法，而不是分类算法。回归算法的目标是预测连续值，而分类算法的目标是预测类别。

这个错误的原因是，你在使用分类指标（例如 ACC，MCC 和 Precision）来评估回归模型的性能，而这些指标是用来评估分类模型性能的，而不是回归模型。

解决方案是，改用回归指标来评估模型性能，如R平方，均方误差，平均绝对误差等。

另外，检查一下输入数据是否是一个连续值，而不是离散值或二元值，如果是离散值或二元值，需要对数据进行预处理。

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(3条)

报告相同问题？

关注问题

关于 train loss、val loss训练时遇到的问题
2022-01-14 11:04

WGS.的博客数据集说明训练集是用于模型的训练的样本集合，确定模型的权重参数。...如果模型在训练集、验证集、测试集的表现都很好，但是在实际用的新数据表现很差，可能的问题：分布不一致，新数据与原数据的特征之间存在差
关于CNN训练时loss停留在0.69，acc为0.5左右的问题
2022-04-13 15:45

S-Tatum的博客最近在用CNN作为主干网络来训练二分器时，出现了loss停留在0.69左右，acc在0.5左右的情况，在这里记录一下解决方法。首先是我在网上收集到的方法以及我最终的解决方法。方法1：查看数据有没有问题，看输入的数据...
使用用测试时数据增强（TTA）提高预测结果
2021-01-05 09:23

deephub的博客数据增强是一种用于提高计算机视觉问题神经网络模型的性能和减少泛化误差的技术。当使用拟合模型进行预测时，也可以应用图像数据增强技术，以允许模型对测试数据集中每幅图像的多个不同版本进行预测。对增强图像的...
Matlab有限元编程：Newmark-Beta求解动力学问题(附源码) | 隐式与显式方法 | 框架结构地震弹性时程分析
2024-08-21 13:50

suoge223的博客本文主要讲解如何利用Matlab通过有限元编程实现框架结构在地震作用下弹性时程分析，重点介绍了Newmark-Beta求解方法（隐式方法）和瑞丽阻尼矩阵的基本原理及算法流程，并通过Matlab程序介绍了Newmark-Beta方法的和...
使用pytorch时遇到的问题汇总
2019-08-09 17:11

vivian_ll的博客遇到问题： embedding的时候遇到数据加载的时候遇到TypeError: 'int' object is not callable 问题：数据不是Tensor类型的而是np.array或其他类型的。解决： tensor = torch.LongTensor(data_x) data_x = ...
编程语言：类型系统的本质
2022-07-02 14:41

光子AI的博客在使用函数式语言进行编程后，就能够很清晰地理解为什么随着时间的推移，更主流的语言开始采用函数式语言中的一些被认为理所当然的特性。我将多年间学习类型系统和编程语言开发的经验汇聚起来，加以提炼，并辅以现实...
使用pytorch时遇到的问题汇总(一)
2020-04-18 23:49

绛洞花主敏明的博客 1、报错TypeError: unhashable type: ‘numpy.ndarray’ ...其实程序输出已经是int了，但是还是会被认为是ndarray。解决：在原来的基础上加上.item() classId = support_y[i].long().cpu().detach()....
Python - 深度学习训练过程使用matplotlib.pyplot实时动态显示loss和acc曲线
2021-07-19 13:56

HW140701的博客 1 深度学习训练过程中实时动态显示loss和acc曲线可参考代码如下： # -*- coding: utf-8 -*- import matplotlib.pyplot as plt if __name__ == '__main__': train_loss = 5 val_loss = 5 train_acc = 0.0 val_...
skmetrics输出acc、precision、recall、f1值相同的问题
2021-08-26 11:00

江南马杀鸡的博客 acc = skmetrics.accuracy_score(y_true, y_pred) b_acc = skmetrics.balanced_accuracy_score(y_true, y_pred) k = skmetrics.cohen_kappa_score(y_true, y_pred) precision = skmetrics.precision_score(y_true,...
at89c51编程语言,(最新整理)AT89C51单片机简介
2021-05-23 20:52

PeterPan(fake)的博客《(最新整理)AT89C51单片机简介》由会员分享，可在线阅读，更多相关《(最新整理)AT89C51单片机简介(6页珍藏版)》请在人人文库网上搜索。1、完整)AT89C51单片机简介(完整)AT89C51单片机简介编辑整理：尊敬的读者朋友...
编程语言-什么是低级语言？
2021-07-03 20:53

bearx...的博客人们想要和计算机打交道并且让计算机帮助我们去做一些事情时，作为主动传达信息的人们则需要‘说’一些计算机能听懂的‘语言’（0010100110）也就是常说的编程语言。计算机早期的时候人们的目的只有一个，让计算机...
Java 同步锁性能的最佳实践：从理论到实践的完整指南
2024-12-01 23:53

张彦峰ZYF的博客在多线程编程中，锁是保证线程安全的重要手段之一，但如何选择合适的锁并进行优化，一直是我们面临的挑战。本博客探讨Java中同步锁的性能分析与优化之路，从使用同步锁和不使用同步锁的性能对比入手，逐步展开对锁的...
机器学习——评价指标（ACC、SN、SP、MCC、F1-score）
2023-03-28 13:13

m0_45917886的博客机器学习分类评价指标：TP、FP、FN、TN、ACC、SN、SP、MCC
机器学习评估指标 - f1, precision, recall, acc, MCC
2022-09-20 16:01

无脑敲代码，bug漫天飞的博客机器学习评估指标 - f1, precision, recall, acc, MCC
下列python语句的输出结果是print_下列 Python语句的输出结果是
2021-02-11 17:44

肥猪王大锤的博客【填空题】遍历输出文件所有行。 f=open("d:\\r2.txt","r") while True: str= print(str,end='') if not str: break f.close()【填空题】Pyhon语句序列"s1= 'red hat'; print(str.upper(s1))”的运行结果是?【单选题...
【实用工具系列】MathCAD入门安装及快速上手使用教程
2022-08-07 22:30

左手の明天的博客 mathcad是一款功能强大的工程计算软件，...标准的数字符号帮助你更好的运算，文本和图形提供您的设计，将这些集中在一个工作表中，可广泛应用于土木工程、电子工程、数据分析、信号处理、图像处理、数学等多个领域。...
语言中要输出表格_手把手教你用R语言快速制作出SCI中的表一
2021-01-10 03:27

崔一墩的博客在既往SPSS教程中，我们已经教大家使用SPSS对变量进行分组转换做出SCI表一，但是使用SPSS需要对每个变量单独进行计算，然后手动输入制表，在变量比较多的，数据比较大的文件比较麻烦，今天我们来使用R语言轻松做出...
stm32是以c语言来编程吗,stm32用什么语言编程
2021-05-23 05:59

惚兮的博客描述编程语言(programming language)，是用来定义计算机程序的形式语言。它是一种被标准化的交流技巧，用来向计算机发出指令。一种计算机语言让程序员能够准确地定义计算机所需要使用的数据，并精确地定义在不同情况...
在pycharm中使用matplotlib时多张图显示问题
2018-11-26 10:51

Zhang_xi_xi_94的博客在初次使用matplotlib在Spyder软件中试图画出模型的ACC和LOSS曲线时可以顺利的生成两张图，但同样的程序放入pycharm中时，却只显示一张图，而且程序一直处于运行状态，百思不得其解，最后发现关掉（点x）第一张图...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 1月28日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 1月20日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 1月16日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 1月16日