模仿鸢尾花数据的交叉验证时，如何以自己导入的数据替代iris.data, iris.target？

问题遇到的现象和发生背景

我需要利用股票数据做决策树分类器，我把A股市值作为y，其余特征项作为x，仿照鸢尾花数据集的案例构造决策树，交叉验证的时候我用df_X和df_y代替iris.data, iris.target，但试了很多次都有报错，这次是大片红色报错，请问有人知道该怎么改吗？
网上鸢尾花数据交叉验证的参考：

cross_val_score(clf, iris.data, iris.target, cv=10)

问题相关代码，请勿粘贴截图

from sklearn import tree
import pandas as pd
df=pd.read_excel('数据.xlsx') #读取数据
type(df)
'化连续为离散'
df=pd.read_excel('数据.xlsx')
df=df.dropna()
df=df.drop(0,axis = 0)
df=df.iloc[::-1]
df_diff=df.iloc[:,1:].diff(axis = 0)
df[df_diff >= 0] = 1   #变量上涨则赋值为1
df[df_diff < 0] = 0    #变量下跌则赋值为0
df=df.reset_index(drop = True) #重置索引
df=df.drop(0,axis = 0) #删除无法赋值的第0行
df=df.drop('指标名称',axis = 1) #删除日期列
df=df.reset_index(drop = True) #重置索引
df
'分离训练集与数据集'
train=df.head(211)
test=df.tail(8)
test=test.reset_index(drop = True)
X_train=train.drop('上证A股指数',axis = 1)
X_test=test.drop('上证A股指数',axis = 1)
y_train=train['上证A股指数']
y_test=test['上证A股指数']
'强制转换数据类型'
X_train=X_train.astype('int')
X_test=X_test.astype('int')
y_train=y_train.astype('int')
y_test=y_test.astype('int')
'构造决策树'
from sklearn import tree
clf = tree.DecisionTreeClassifier() #创建分类器对象
clf.fit(X_train,y_train) #用训练集拟合分类器模型
clf.predict(X_test) #用训练好的分类器预测数据的标签
'交叉验证'
from sklearn.model_selection import cross_val_score
from sklearn import tree
clf = tree.DecisionTreeClassifier() #创建分类器对象
df_X=df.drop('上证A股指数',axis = 1)
df_y=df['上证A股指数']
score = cross_val_score(clf,df_X,df_y,cv=10,scoring='accuracy')

运行结果及报错内容

D:\Anaconda\lib\site-packages\sklearn\model_selection_validation.py:536: FitFailedWarning: Estimator fit failed. The score on this train-test partition for these parameters will be set to nan. Details:
ValueError: Unknown label type: 'unknown'

FitFailedWarning)

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
东华果汁哥 2021-12-11 18:15
关注
问题分析：
iris.data 类型是一个数据框
iris.target 类型是一pandas.Seris 序列

解决办法：
1、首先用data=pd.read_csv() 方法读取数据集
如：# 导入txt数据
data=pd.read_csv(train_data_path,sep='\t')
2、把特征和目标赋值给X_train，y_train 相当于iris.data，iris.target

筛选自变量

X_train=data.iloc[:,:-1]

筛选因变量

y_train=data.iloc[:,-1]

望采纳，谢谢！

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

报告相同问题？

关注问题

iris.rar_Iris数据集_data set in matlab_iris
2022-09-23 11:10

打开这个文件后，可以使用Matlab的命令来加载数据，如 `load iris`，然后通过变量名（例如 `iris.data` 或 `iris.samples`）访问数据矩阵，通过 `iris.target` 或 `iris.classes` 访问类别信息。在数据分析中，...
SAS使用鸢尾花(iris)数据集训练人工神经网络(ANN)模型
2023-03-23 15:52

在这个场景中，我们将关注如何使用SAS来训练一个人工神经网络（ANN）模型，具体是基于经典的鸢尾花（Iris）数据集。鸢尾花数据集是数据挖掘和机器学习中的一个标准示例，包含了三种不同鸢尾花品种的4个特征：萼片...
sklearn基础篇（三）-- 鸢尾花(iris)数据集分析和分类
2022-10-28 08:00

长路漫漫2021的博客本文是基于《Python机器学习基础教程》第一章学习的总结，主要是基于iris数据集进行探索数据分析和不同分类模型的对比，从而熟悉使用sklearn的模型进行机器学习。
【scikit-learn】sklearn.datasets.load_iris() 函数： 鸢尾花（Iris）多分类数据集
2025-03-17 10:00

彬彬侠的博客 load_iris()是sklearn.datasets提供的鸢尾花（Iris）数据集，是一个多分类数据集，常用于分类任务的测试与实验。load_iris()提供了150个鸢尾花样本，用于多分类任务，适用于机器学习算法测试。可以转换为Pandas...
python数据分析和可视化鸢尾花数据分析-python鸢尾花
2025-04-08 22:22

一个基于Python的鸢尾花数据分析与可视化代码示例，结合数据探索、特征分布展示、多维度关系分析和分类边界可视化，并包含丰富的可视化图表： # 导入必要库（需提前安装：pip install pandas seaborn matplotlib ...
机器学习与深度学习-通过SVM线性支持向量机分类鸢尾花数据集iris求出错误率并可视化.zip
2024-01-02 15:56

1、先载入iris数据集 Load Iris data 2、分离训练集和设置测试集split train and test sets 3、对数据进行标准化处理Normalize the data 4、使用知识向量机模型进行训练Train using SVM 5、然后进行可视化处理...
鸢尾花训练数据.zip
2021-06-04 15:58

鸢尾花训练数据集是一个广泛使用的多类分类问题的数据集，尤其在机器学习和数据分析领域。这个数据集包含了150个样本，每个样本都属于三种鸢尾花（Setosa，Versicolour，Virginica）中的一种。这些花卉的四个特征被...
鸢尾花数据集-数据分析.pdf
2022-12-24 10:59

在这个分析中，我们首先通过`sklearn.datasets.load_iris()`导入鸢尾花数据集，并将其转换为pandas DataFrame以便于处理。DataFrame `lris_df.data`包含了输入特征，而`lris_df.target`则是目标特征，即鸢尾花的种类...
python导入鸢尾花数据集_用Python进行K次交叉验证，探索鸢尾花数据集（含代码）...
2020-11-23 19:21

weixin_39975868的博客 K次交叉验证，将训练集朋分成K个子样本，一个零丁的子样本被保存作为验证模型的数据，其他K-1个样本用来训练。交叉验证重复K次，每个子样本验证一次，平均K次的结果或者使用其它结合体例，最终获得一个单一估测。这...
Python-鸢尾花数据集Iris 数据可视化：读取数据、显示数据、描述性统计、散点图、直方图、KDE图、箱线图
2020-12-20 22:20

本文将详细探讨如何使用Python的鸢尾花数据集（Iris）进行数据可视化，包括读取数据、显示数据、描述性统计以及各种图表的绘制。 **1. 读取数据** 鸢尾花数据集是数据科学中非常经典的一个例子，它包含了150个样本...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 12月23日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 12月15日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
赞助了问题酬金 12月11日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 12月11日
展开全部

模仿鸢尾花数据的交叉验证时，如何以自己导入的数据替代iris.data, iris.target？

问题遇到的现象和发生背景

问题相关代码，请勿粘贴截图

运行结果及报错内容

2条回答 默认 最新

筛选自变量

筛选因变量

问题事件

2条回答默认最新