Python-交叉验证得到最优模型？

问题遇到的现象和发生背景

我现在是在使用Python的sklearn做GBDT，现在主要遇到的问题是：使用交叉验证得到最优模型。但问题是我不知道怎么使用k折的交叉验证得到最优模型。因为k折的交叉验证是将数据分为k份数据，每个数据用于模型，但得到的k个模型怎样进行整合，或是怎样得到最优模型？
并且怎么使用随机搜索进行最优参数的选取？

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

3条回答默认最新

梦什 2022-05-27 23:45

关注

如果你能接受调包的话，就是下面这样
我这里是以决策树模型为例的：
k折交叉验证

# 代码实现
from sklearn.model_selection import cross_val_score
acc = cross_val_score(model, X, y, cv=5)        
# 5折交叉验证，默认是3折，这里没有设置scoring参数，所以是用默认的 'accuracy'（准确度）作为评估标准
print(acc)

# 5折交叉验证的均值
acc.mean()

网格搜索（需要自己输入参数）

import numpy as np
from sklearn.model_selection import GridSearchCV

# 指定参数范围，最大深度，特征选择标准，子节点往下分裂所需的最小样本数
parameters = {'max_depth':np.arange(5,14,2),
             'criterion':['gini','entropy'],
             'min_samples_split':np.arange(5,16,2)}

# 构建决策树模型
model = DecisionTreeClassifier()

# 网格搜索
grid_search = GridSearchCV(model,parameters,scoring='roc_auc',cv=5)

grid_search.fit(X_train,y_train)

# 输出参数的最优值
grid_search.best_params_

本回答被题主选为最佳回答 , 对您是否有帮助呢?

查看更多回答(2条)

报告相同问题？

关注问题

从0开始机器学习--2.ai模型概念+基础（什么是机器学习、特征选择、超参数、交叉验证？机器学习的类型有哪些？训练集-验证集-测试集？SOTA？Pipeline？backbone？zero-shot）
2024-10-02 20:24

LetItRun的博客非参数模型超参数 交叉验证 梯度下降学习率（步长）三种不同的学习类型对比数据集种类特征选择特征选择的过程 Python代码支持 “SOTA” pipeline backbone zero-shot 总结机器学习在学习机器学习之前，我们...
【python】KNN02-交叉验证
2022-07-09 23:05

Htht111的博客 KNN交叉验证
人工智能-python-机器学习-模型选择与调优实战指南：从交叉验证到朴素贝叶斯分类
2025-08-10 15:59

IMER SIMPLE的博客本文介绍了机器学习中的模型选择与调优方法，重点探讨了交叉验证技术和朴素贝叶斯分类。交叉验证部分对比了保留验证、K折验证和分层K折验证等方法的优缺点及适用场景。超参数调优部分分析了网格搜索和随机搜索的特点...
模型预测笔记(三)：通过交叉验证网格搜索机器学习的最优参数
2023-08-24 17:06

ZZY_dl的博客网格搜索（Grid Search）是一种超参数优化方法，用于选择最佳的模型超参数组合。在机器学习中，超参数是在...网格搜索通过尝试所有可能的超参数组合，并使用交叉验证来评估每个组合的性能，从而确定最佳的超参数组合。
AI-机器学习模型评估神器：交叉验证全解析
2025-06-29 20:38

陈乔布斯的博客 交叉验证是机器学习中评估模型性能的关键方法，通过多次数据划分和训练测试，避免单一测试集的随机偏差。本文详解了四种主要方法：简单交叉验证（基础二分法）、K折交叉验证（稳健多轮验证）、留一法（极致的全面...
人工智能-机器学习笔记-001-交叉验证方法
2024-05-03 00:01

Oreo0753的博客 交叉验证（模型评估方法）基本概念 交叉验证是一种统计方法，用于评估并比较机器学习模型的性能。它主要用于防止模型的过拟合。在交叉验证中，数据集被分成几个大小相等的部分。 1、为什么需要交叉验证 ? 交叉验证...
【Python机器学习】模型评估与改进——交叉验证
2024-06-28 17:51

zhangbin_237的博客 交叉验证是一种评估泛化性能的统计学方法，它比单次划分训练集和测试集的方法更稳定...在交叉验证中，数据被多次划分，并且需要训练多个模型。最常用的交叉验证是k折交叉验证，其中k是由用户指定的数字，通常取5或10,。
【python 机器学习】xgboost最优模型构建方法
2025-04-26 11:16

人才程序员的博客假设你经营一个智能农场，需要预测未来一周的农作物产量。
机器学习-KNN近邻算法分类模型、交叉验证
2024-01-17 11:30

LLM教程的博客适用场景小数据场景，样本为几千，几万的 K折交叉验证 目的：选出最为适合的模型超参数的取值，然后将超参数的值作用到模型的创建中。思想：将样本的训练数据交叉的拆分出不同的训练集和验证集，使用交叉拆分出...
深度学习-训练网络后直接进行验证保存最优模型
2023-03-25 08:26

鲤余的博客【代码】深度学习-训练网络后直接进行验证保存最优模型。
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 6月11日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 6月3日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 5月27日

Python-交叉验证得到最优模型？

问题遇到的现象和发生背景

3条回答 默认 最新

问题事件

3条回答默认最新