用机器学习模型测试集上准确度和AUC都很高，但是学习曲线很奇怪

刚接触机器学习，懵懵懂懂写了个Python的gradientboosting，训练集和测试集上的表现都还好，但是学习曲线很奇怪，一个在天上飞一个在地下爬，请问是什么原因啊

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
CSDN-Ada助手 CSDN-AI 官方账号 2024-03-21 10:07
关注
【以下回答由 GPT 生成】

解决方案:

这种情况可能是由于过拟合(overfitting)导致的。过拟合是指模型在训练集上表现良好，但在测试集上表现不佳的情况。在你描述的情况中，准确度和AUC高，但学习曲线呈现奇怪的趋势，这很可能是过拟合的表现。

下面是一些解决过拟合问题的方法：

增加训练数据集： 增加训练数据集可以减少过拟合的发生。更多的数据可以帮助模型更好地泛化。

正则化(Regularization)： 使用正则化的技术可以帮助减少过拟合。比如，在Gradient Boosting模型中，可以控制树的深度、叶子节点数等参数。

交叉验证(Cross-validation)： 使用交叉验证可以帮助评估模型的泛化能力，同时可以调整模型的参数来减少过拟合。

特征工程(Feature Engineering)： 优化特征工程可以提高模型的泛化能力，减少过拟合的风险。

提前停止(Early Stopping)： 在训练模型时，可以监控模型在验证集上的表现，并在表现开始下降时停止训练，避免过拟合。

你可以尝试以上方法来解决你遇到的问题。如果以上方法都不奏效，可能需要进一步分析模型和数据集来找出问题的根源。

希望这些信息能帮助你解决问题！如果有任何疑问，请随时告诉我。

如果你已经解决了该问题, 非常希望你能够分享一下解决方案, 写成博客, 将相关链接放在评论区, 以帮助更多的人 ^-^
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

机器学习模型评估指标ROC、AUC详解
2021-06-10 00:34

数据不吹牛的博客我是小zROC/AUC作为机器学习的评估指标非常重要，也是面试中经常出现的问题（80%都会问到）。其实，理解它并不是非常难，但是好多朋友都遇到了一个相同的问题，那就是：每次看书的时候都很明...
Python机器学习从入门到高级：模型评估和选择（含详细代码）
2022-05-05 07:00

JOJO数据科学的博客之前我们介绍了机器学习的一些基础性工作，介绍了如何对数据进行预处理，接下来我们可以根据这些数据以及我们的研究目标建立模型。那么如何选择合适的模型呢？首先需要对这些模型的效果进行评估。本文介绍如何使用`...
谈谈机器学习AI模型测试与评估方法分析
2022-03-22 17:27

肖永威的博客 AI应用软件层出不穷，人们虽然理解人工智能趋势，但是，企业往往很难接受这样AI应用软件，很很多质疑点，本文将从机器学习模型开发过程、AI应用软件开发过程，分析如何进行机器学习AI模型测试与模型评估方法。
机器学习模型解释性概述
2024-06-06 09:08

000X000的博客 机器学习模型解释性
【面试通关秘籍】机器学习&深度学习高频面试题全汇总，大模型面试必备！
2025-06-30 15:19

AI大模型-大飞的博客这篇摘要总结了机器学习面试中的关键知识点，涵盖基础知识、算法原理、模型评估和工程实践四大类。主要内容包括：机器学习核心概念（监督/无监督学习、过拟合/欠拟合）、常用算法（线性回归、SVM、决策树等）、评估...
机器学习分类模型中的评价指标介绍：准确率、精确率、召回率、ROC曲线
2021-02-05 13:49

爱编程的胖子的博客 1 二分类评价指标准确率，精确率，召回率，F1-Score， AUC, ROC, P-R...注意：准确率这一指标在Unbalanced数据集上的表现很差，因为如果我们的正负样本数目差别很大，比如正样本100个，负样本9900个，那么直接把所有
机器学习模型 | Interpretability 和 Explainability 区别
2024-09-06 21:42

斐夷所非的博客 机器学习模型在区分恶性肿瘤和不同类型的良性肿瘤方面是非常准确的，但是我们依然需要专家对诊断结果进行解释，解释为什么一个机器学习模型将某个患者的肿瘤归类为良性或恶性将大大帮助医生信任和使用机器学习模型来...
【机器学习】在【R语言】中的应用：结合【PostgreSQL数据库】的【金融行业信用评分模型】构建
2024-06-16 22:44

小李很执着的博客金融行业由于其高度数据驱动的特点，是机器学习技术应用的理想领域。信用评分作为金融领域的重要应用，通过评估借款人的...本文将详细介绍如何使用R语言结合PostgreSQL数据库，基于公开数据集构建一个信用评分模型。
机器学习没那么难，看完这篇你也能说懂了！| 机器学习项目流程极简入门
2025-05-21 10:20

Gupao123的博客本文详细介绍了机器学习项目的完整流程，通过一个水果分类的简单案例，逐步演示了从数据收集到模型部署的各个步骤。首先，数据收集是基础，需要确保数据的代表性和充分性。接着，数据预处理包括清洗、格式转换、特征...
Python 机器学习 基础之模型评估与改进【评估指标与评分】的简单说明
2024-05-28 16:01

仙魁XAN的博客 Python是一种跨平台的计算机程序设计语言。是一种面向对象的动态类型语言，最初被设计用于编写自动化脚本(shell)，随着版本...Python 机器学习是利用 Python 编程语言中的各种工具和库来实现机器学习算法和技术的过程。
机器学习Python实战-第二章-模型评估（万字解析+带注释源码）
2024-08-29 17:59

HeShen.的博客模型评估万字解析，附带详细源码
图解机器学习算法(2) | 模型评估方法与准则（机器学习通关指南·完结）
2022-03-09 23:53

ShowMeAI的博客在AI场景下，我们同样需要定量的数值化指标，来指导我们更好地应用模型对数据进行学习和建模。本文讲解模型评估的一般流程，以及分类评估指标、回归评估指标的计算方式和适用场景。
【一起啃西瓜书】机器学习-期末复习（不挂科）
2021-12-09 15:23

硬核科技工作室的博客《机器学习》致力于研究如何通过计算的手段，利用经验来改善系统自身的性能，从而在计算机上从数据（经验）中产生“模型”，用于对新的情况给出判断（利用此模型预测未来的一种方法）。分为三类：监督学习、元监督...
Python机器学习教程
2025-12-28 09:32

小鸡吃米…的博客本文介绍了Python机器学习的基础知识，涵盖机器学习的概念、重要性、类型、应用及系统组成。详细解答了常见问题，包括监督与无监督学习的区别、常用算法、模型评估方法以及学习路径。强调了数据准备、工具选择（如...
基于机器学习的银行信贷评分模型研究
2024-09-05 02:05

AGI大模型与大数据研究院的博客基于机器学习的银行信贷评分模型研究作者：禅与计算机程序设计艺术 / Zen and the Art of Computer Programming 1. 背景介绍 1.1 问题的由来银行信贷业务是商业银行的核心业务之一，其发
Python机器学习：从入门到精通
2025-07-18 17:01

莲华君的博客 机器学习，并非冰冷的符码，而是机器模拟人类洞察世界的法门。本书将带您，以Python为舟，泛游于算法之海。我们不只传授“术”，更探求其后的“道”——从数据的生灭流转中观照规律，于模型的迭代演进里体悟得失。愿...
算法优化不再难：AI自动调参工具助力机器学习模型性能提升实践
2025-08-15 08:50

Jinkxs的博客算法优化不再难：AI自动调参工具助力机器学习模型性能提升实践在机器学习项目中，模型性能优化往往卡在“参数调优”这最后一公里。我曾带领团队开发一个用户流失预测模型，使用XGBoost算法时，手动尝试了30多种参数...
机器学习的概念、步骤、分类和实践
2024-03-30 23:50

南方淮竹的博客 机器学习是人工智能（AI）的一个分支，它使计算机能够从数据中学习并做出决策或预测的技术，而无需对每个问题进行明确的程序...机器学习的核心在于开发算法，这些算法可以自动提取信息并使用这些信息来改进自身的性能。
15、机器学习模型训练与持续集成：挑战与解决方案
2025-10-15 11:08

stem5的博客本文探讨了机器学习模型训练与持续集成中的关键挑战及解决方案。涵盖了模型训练中的过拟合、欠拟合、分布式训练编排、自动调优和持续训练等核心问题，提出了训练服务的三大实现模式：分布式训练编排器、自动调优和...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 3月21日

用机器学习模型测试集上准确度和AUC都很高，但是学习曲线很奇怪

2条回答 默认 最新

问题事件

2条回答默认最新