weixin_46537528 2020-07-19 13:40 采纳率: 0%
浏览 1789

如何确定二分类中y_true和y_pred的值?

我是新手,我在天池练习一个数据分析项目时
,遇到一个问题。在分析它的accuracy时,

我不懂他们下面的y_pred是怎么确定的? 它的预测时预测什么啊?

题目:赛题以预测二手车的交易价格为任务,数据集报名后可见并可下载,该数据来自某交易平台的二手车交易记录,总数据量超过40w,包含31列变量信息,其中15列为匿名变量。为了保证比赛的公平性,将会从中抽取15万条作为训练集,5万条作为测试集A,5万条作为测试集B,同时会对name、model、brand和regionCode等信息进行脱敏。

import pandas as pd
import numpy as np
import warnings
warnings.filterwarnings('ignore')

#此处sep的作用是用空格来分割数据表格
Train_data = pd.read_csv('used_car_train_20200313.csv',sep=' ')
Test_data = pd.read_csv('used_car_testB_20200421.csv',sep=' ')
print('Train data shape: ', Train_data.shape)
print('Test data shape: ', Test_data.shape)

## accuracy
import numpy as np
from sklearn.metrics import accuracy_score
y_pred = [0, 1, 0, 1]
y_true = [0, 1, 1, 1]
print('ACC:',accuracy_score(y_true, y_pred))
  • 写回答

1条回答 默认 最新

  • threenewbee 2020-07-19 16:01
    关注

    y_pred = [0, 1, 0, 1]
    y_true = [0, 1, 1, 1]
    这个都是写死的,也就是没有训练,没有预测,只是为了调用accuracy_score
    前者模拟你的预测结果
    后者模拟你的实际结果
    accuracy_score根据这两个参数,计算两者误差。

    评论

报告相同问题?