使用sklearn中的stratifiedkfold进行交叉验证，准确度非常低，不知是什么原因

问题遇到的现象和发生背景

使用sklearn中的train_test_split方法进行4：1划分的时候，测试集准确率是不断上升的，最后稳定在89%左右，而使用Stratifiedkfold进行5折交叉验证的时候测试集准确率很低，最高70-80%，最低10-20%，且不断震荡，训练集准确率不断上升。

问题相关代码，请勿粘贴截图

使用train_test_split代码：
xtrain,xtest,ytrain,ytest =train_test_split(x,y,test_size=0.2,shuffle=True,stratified=y)
使用stratifiedKfold代码：
skf=StratifiedKFold(n_splits=5,shuffle=True).split(x,y)
for train_index,test_index in skf:
xtrain,xtest=x[train_index],x[test_index]
ytrain,ytest=y[train_index],y[test_index]
除此处数据集划分不同之外，其他所有地方（模型，优化器，epoch等等）都是一样，没有改变
已经困在这好几天了，求解惑！

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
XT学习 2022-03-20 13:54
关注
正常

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

k折交叉验证选取准确率最高的结果可以吗 sklearn 机器学习深度学习
2021-11-16 15:33

回答 1 已采纳如你所说，它最终是一个模型的评价指标，用于评价模型的能力。用k折交叉，是为了尽可能消除因为数据的划分带来的波动，选取平均结果很大程度上减小了因为某次数据划分失衡带来的误差；取极值其实是放大了这个误差
使用sklearn进行线性回归时遇到的问题 python sklearn 线性回归
2023-02-13 20:39

回答 3 已采纳基于Monster 组和GPT的调写：使用 Scikit-learn 的机器学习模型时，通常都是先实例化一个模型对象，然后再调用其 fit 方法来拟合模型。如果直接调用 LinearRegressio
已成功安装sklearn，Python使用from却无法使用！ python sklearn 人工智能
2022-04-07 20:37

回答 1 已采纳可以打印一下路径看sklearn的地址是否在其中 import sys # 图中sklearn的安装路径 sklearn_path = 'D:\\p.ython 3.8.0_x64\\lib\\si
【sklearn库】【安装】【交叉验证】
2024-03-13 10:20

资源存储库的博客 sklearn 库集成了一些常用的机器学习方法,在进行机器学习任务时,并不需要实现算法,只需要简单的调用 sklearn 库中提供的模块就能完成大多数的机器学习任务。sklearn 库是在 Numpy 、 Scipy 和 matplotlib 的基础上...
pytorch图像数据集怎么进行交叉验证 神经网络
2019-08-03 16:43

回答 1 已采纳 https://blog.csdn.net/weixin_42892943/article/details/95195272
sklearn中knn算法中的weights=uniform时，相当于投票决定吗 python sklearn 机器学习
2023-04-05 15:31

回答 1 已采纳 uniform是均等的权重，就是说所有的邻近点的权重都是相等的，就是投票决定
想验证模型效果，sklearn中划分训练集、测试集的train_test_split需要设定相同的随机数种子吗 python sklearn 机器学习
2021-11-23 17:39

回答 1 已采纳需要保持一致
人工智能-机器学习笔记-001-交叉验证方法
2024-05-03 00:01

Oreo0753的博客 784) y_train_5.shape (60000,) —不调用函数，利用for循环实现交叉验证 #StratifiedKFold使用模版 from sklearn.model_selection import StratifiedKFold X = ... # 特征数据 y = ... # 目标数据 skf = ...
Python-交叉验证得到最优模型？ python sklearn 决策树
2022-05-27 22:49

回答 3 已采纳如果你能接受调包的话，就是下面这样我这里是以决策树模型为例的：k折交叉验证 # 代码实现 from sklearn.model_selection import cross_val_score acc
这是下载sklearn时出现的warning 怎么解决呢 python sklearn
2022-01-12 18:18

回答 2 已采纳这个报的是pip的更新，其实你不更新pip也没事，不影响你sklearn的使用
使用sklearn的决策树来分类鸢尾花数据时为啥生成的决策树PDF闪退？ python sklearn 决策树有问必答
2022-03-25 09:23

回答 3 已采纳在最后加这两行试试 import os os.system('iris.pdf')
在sklearn中如何实现参数网格搜索（GridSearch）？
2024-06-20 16:12

2401_85761762的博客是sklearn中的一个类，用于通过网格搜索（Grid Search）方法来寻找最优的模型超参数。它通过遍历给定的参数网格，对每一组参数进行交叉验证，并根据评分标准选择出最优的参数组合。
python有没有那个版本可以同时使用karas、tensorflow、sklearn? tensorflow 人工智能机器学习深度学习神经网络
2019-12-23 22:09

回答 2 已采纳用的python3.7，安装的anaconda，然后pip install tensorflow和pip install keras，自动安装的默认版本，tf应该是1.14，keras忘了，直接能用。
keras sklearn下两分类/多分类的技术杂谈（交叉验证和评价指标）
2020-03-29 15:20

做一只AI小能手的博客 1.1K-FOLD交叉验证 概念：对一个模型进行K次训练，每次训练将整个数据集分为随机的K份，K-1作为训练集，剩余的1份作为验证集，每次训练结束将验证集上的性能指标保存下来，最后对K个结果进行平均...
人工智能--k近邻算法2-归一化、交叉验证、网格搜索、数据分割方法总结、两案例实现
2022-11-13 16:51

海星？海欣！的博客 人工智能--k近邻算法2-归一化、交叉验证、网格搜索、数据分割方法总结、两案例实现
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 3月20日

悬赏问题

¥20 三极管1000倍放大电路
¥15 vscode报错如何解决
¥15 前端vue CryptoJS Aes CBC加密后端java解密
¥15 python随机森林对两个excel表格读取，shap报错
¥15 基于STM32心率血氧监测（OLED显示）相关代码运行成功后烧录成功OLED显示屏不显示的原因是什么
¥100 X轴为分离变量（因子变量），如何控制X轴每个分类变量的长度。
¥30 求给定范围的全体素数p的(p-2)/p的连乘积值
¥15 VFP如何使用阿里TTS实现文字转语音？
¥100 需要跳转番茄畅听app的adb命令
¥50 寻找一位有逆向游戏盾sdk 应用程序经验的技术