如何确定二分类中y_true和y_pred的值？

我是新手，我在天池练习一个数据分析项目时
，遇到一个问题。在分析它的accuracy时，

我不懂他们下面的y_pred是怎么确定的？它的预测时预测什么啊？

题目：赛题以预测二手车的交易价格为任务，数据集报名后可见并可下载，该数据来自某交易平台的二手车交易记录，总数据量超过40w，包含31列变量信息，其中15列为匿名变量。为了保证比赛的公平性，将会从中抽取15万条作为训练集，5万条作为测试集A，5万条作为测试集B，同时会对name、model、brand和regionCode等信息进行脱敏。

import pandas as pd
import numpy as np
import warnings
warnings.filterwarnings('ignore')

#此处sep的作用是用空格来分割数据表格
Train_data = pd.read_csv('used_car_train_20200313.csv',sep=' ')
Test_data = pd.read_csv('used_car_testB_20200421.csv',sep=' ')
print('Train data shape: ', Train_data.shape)
print('Test data shape: ', Test_data.shape)

## accuracy
import numpy as np
from sklearn.metrics import accuracy_score
y_pred = [0, 1, 0, 1]
y_true = [0, 1, 1, 1]
print('ACC:',accuracy_score(y_true, y_pred))

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
threenewbee 2020-07-19 16:01
关注
y_pred = [0, 1, 0, 1]
y_true = [0, 1, 1, 1]
这个都是写死的，也就是没有训练，没有预测，只是为了调用accuracy_score
前者模拟你的预测结果
后者模拟你的实际结果
accuracy_score根据这两个参数，计算两者误差。

解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

如何解决y_true和y_predict数据类型不匹配的问题
2025-01-04 01:31

bug菌¹的博客解决y_true和y_predict确保它们的数据类型一致（list等）。确保标签的格式一致，特别是在分类问题中，确保类别标签的类型一致（整数或字符串）。如果是回归问题，确保它们是浮动小数类型。检查模型输出，确保预测值...
【笔记】分类模型，混淆矩阵sklearn实现：sklearn.metrics.confusion_matrix(y_true, y_pred, labels=None)返回值：一个格式化的字符串
2021-11-19 08:46

程序猿的探索之路的博客混淆矩阵sklearn实现：sklearn.metrics.confusion_matrix(y_true, y_pred, labels=None)返回值：一个格式化的字符串，给出了分类结果的混淆矩阵。参数：参考classification_report 。混淆矩阵的内容如下，其中Cij...
二分类任务模型的评估（roc_auc）
2024-03-04 21:32

记录问题的菜鸡的博客关于二分类任务中ROC曲线的修改。
Tensorflow与keras学习 (8)——实现f1_score(多分类、二分类)
2019-10-24 17:42

Arthur.AI的博客 keras学习：实现f1_score(多分类、二分类) 本文链接：https://blog.csdn.net/linxid/article/details/82861957 首先容易谷歌到的两种方法: 1.构造metrics 这种方法适用于二分类，在模型训练的时候可以作为...
机器学习模型中预测方法predict和predict_proba
2025-11-07 09:18

流烟默的博客机器学习模型预测方法的选择和应用场景： predict() 与 predict_proba() 的区别 predict() 直接输出类别标签（如0/1），适用于只需分类结果的场景。 predict_proba() 输出概率（如类别1的概率），适用于需置信度、...
机器学习深度学学习分类模型中常用的评价指标总结记录与代码实现说明
2023-12-04 12:27

Together_CZ的博客机器学习深度学学习分类模型中常用的评价指标总结记录与代码实现说明
机器学习分类算法之XGBoost（集成学习算法）
2022-02-14 10:46

王小王-123的博客目录走进XGBoost 什么是XGBoost？ XGBoost树的定义 XGBoost核心算法正则项：树的复杂程度 XGBoost与GBDT有什么...调整max_depth 和min_child_weight 调整gamma 调整subsample 和colsample_bytree 调整正则
案例系列：银行信用卡欺诈_不均衡数据二分类
2023-12-20 12:18

数智笔记的博客缩放后的金额和时间是具有缩放值的列。在我们的数据集中有492个欺诈案例，所以我们可以随机选择492个非欺诈案例来创建我们的新子数据框。我们将492个欺诈案例和非欺诈案例连接起来，创建一个新的子样本。# 导入所需...
pytorch中有哪些损失函数
2025-03-18 16:49

羞儿的博客每一个样本经过模型后会得到一个预测值，然后得到的预测值和真实值的差值就成为损失（当然损失值越小证明模型越是成功），我们知道有许多不同种类的损失函数，这些函数本质上就是计算预测值和真实值的差距的一类型...
metrics.confusion_matrix函数介绍
2024-12-12 15:16

浊酒南街的博客 metrics.confusion_...其中，y_true 是真实的类别标签，y_pred 是模型在测试集上预测的类别标签。confusion_matrix 函数将返回一个二维数组，行代表真实类别，列代表预测类别，数组中的元素表示对应类别的样本数量。
PyTorch 二分类损失函数详解：BCELoss vs BCEWithLogitsLoss 最佳实践指南
2025-11-30 18:14

All The Way North-的博客本文介绍了PyTorch中二分类任务常用的两种损失函数BCELoss和BCEWithLogitsLoss。BCELoss要求输入经过Sigmoid处理的概率值(0-1之间)，而BCEWithLogitsLoss直接接收模型输出的logits值，内部自动完成Sigmoid转换，具有...
keras 和 tensorflow主要组件
2024-06-17 13:03

heeheeai的博客代码实现（使用TensorFlow）: import tensorflow as tf def mse_loss(y_true, y_pred): return tf.reduce_mean(tf.square(y_true - y_pred)) # 示例 y_true = tf.constant([1.0, 2.0, 3.0]) y_pred = tf.constant(...
sklearn 笔记 metrics
2024-04-23 22:48

UQI-LIUWJ的博客在多标签分类中，此函数计算子集准确率：y_pred的标签集必须与 y_true 中的相应标签集完全匹配。
AI大模型实战：用于情感分类的传统人工智能与生成式人工智能
2025-01-13 10:49

我爱学大模型的博客情感分析是自然语言处理（NLP）中的一项关键任务，旨在将文本分类为积极、消极或中性情感。它使企业能够从客户反馈中获得洞察。我们的目标是探索和比较多种二元情感分类方法，评估它们的性能和计算效率。这些方法从...
全面解析 classification_report：评估分类模型性能的利器
2025-04-23 22:17

司南锤的博客还会计算加权平均（weighted avg）、宏平均（macro avg）和微平均（micro avg），从而全面评估模型的整体表现。在机器学习中，分类任务是最常见的应用场景之一。无论是垃圾邮件过滤、图像识别还是情感分析，分类模型...
average 中参数讲解
2025-07-18 17:51

AI扶我青云志的博客 'binary'（默认）：二分类任务 'micro'：全局汇总TP/FP/FN后计算 'macro'：各类得分的算术平均 'weighted'：按样本数加权的平均 'samples'：多标签任务中按样本平均 None：返回各类分数选择建议：二分类用binary；...
Elman_神经网络在卫星遥感图像分类中的应用(附DeepSeek行业解决方案100+)
2025-07-19 09:43

fanxbl957的博客卫星遥感图像分类是将遥感图像中的像素按照其特征划分为不同类别的过程，在土地利用监测、环境评估、灾害预警等领域具有重要的应用价值。传统的图像分类方法在处理复杂的遥感图像时存在一定的局限性，而 Elman 神经...
机器学习实战：逻辑回归深度解析与欺诈检测评估指标详解（二）
2025-08-04 21:43

Sunhen_Qiletian的博客全面掌握分类模型核心评估指标，深入解析混淆矩阵原理，揭示在信用卡欺诈和银行贷款场景中召回率的战略重要性。
【人工智能-练习】三个案例搞明白机器学习中的三大任务：分类、回归、聚类
2024-10-21 11:04

若北辰的博客在机器学习中，常见的三大任务包括分类、回归和聚类。它们分别处理不同类型的预测和数据分析问题，应用广泛，涵盖了从数据分组到连续值预测的多个领域。分类任务关注将数据分到不同类别，回归任务关注预测连续数值，...
AI人工智能领域分类的科技奥秘
2025-04-22 22:35

AI智能探索者的博客随着科技的飞速发展，人工智能（AI）已经成为当今世界最热门的领域之一。AI的应用范围广泛，涵盖了医疗、金融、交通、娱乐等多个行业。然而，AI领域包含众多的子领域和技术，这些领域之间既有联系又有区别。本文的...
没有解决我的问题, 去提问

如何确定二分类中y_true和y_pred的值？

1条回答 默认 最新

1条回答默认最新