关注
码龄 粉丝数 原力等级 --
- 被采纳
- 被点赞
- 采纳率
已结题
非独立同分布的数据集成学习效果变差是什么原因?
收起
- 写回答
- 好问题 0 提建议
- 关注问题
微信扫一扫点击复制链接分享
- 邀请回答
- 编辑 收藏 删除
- 收藏 举报
0条回答 默认 最新
报告相同问题?
提交
- 2024-11-28 20:18西柚小萌新吖(●ˇ∀ˇ●)的博客 机器学习领域有一个强大的思路:集成学习,该方法在诸多机器学习竞赛中往往能够获得最优的结果。集成学习的基本思想实际上非常简单:三个臭皮匠顶一个诸葛亮,即将多个模型组合在一起获得的效果往往要强于单一模型。
- 2025-09-19 23:18SuperAGI架构师的AI实验室的博客 集成学习(Ensemble Learning)正是为解决这类问题而生——它通过组合多个“性格不同”的基模型(如决策树、逻辑回归),让整体效果远超单个模型。本文将覆盖集成学习的三大主流框架(Bagging/Boosting/Stacking),...
- 2025-06-10 00:20Echo_Wish的博客 数据科学里的“多面手”——聊聊集成学习那些不得不说的事
- 2025-09-24 18:58程序员光剑的博客 分层集成:将ML能力嵌入大数据架构的采集、存储、处理、训练、部署、监控全层级,避免“数据孤岛”和“模型孤岛”;数据优先:从采集层开始就考虑特征化,用湖仓一体保证数据的一致性和可追溯性;分布式与自动化:用...
- 2022-06-19 17:32落花雨时的博客 XGBoost(Extreme Gradient Boosting)全名叫极端梯度提升树,XGBoost是集成学习方法的王牌,在Kaggle数据挖掘比赛中,大部分获胜者用了XGBoost。XGBoost在绝大多数的回归和分类问题上表现的十分顶尖,本节将较详细...
- 2025-09-18 19:06墨利昂的博客 数据预处理时,要处理缺失值(比如 “近 30 天登录次数” 缺失的,可填 0,代表没登录)、异常值(比如 “每月消费金额” 超过 10 万的,可能是误录,可按 99% 分位数截断)。等对工具熟悉后,再回头看数学原理,会...
- 2020-06-02 09:55B站:阿里武的博客 集成学习(Ensemble Learning)有时也被笼统地称作提升(Boosting)方法,广泛用于分类和回归任务。它最初的思想很简单:使用一些(不同的)方法改变原始训练样本的分布,从而构建多个不同的分类器,并将这些分类器...
- 2022-12-04 22:36subsistent的博客 介绍机器学习的基础概念和知识,包括机器学习简史、主要流派、与人工智能、数据挖掘的关系、应用领域、算法、一般流程等。伴随着计算机计算能力的不断提升以及大数据时代的迅发展人工智能也取得了前所未有的进步。
- 2025-05-12 16:20快撑死的鱼的博客 当模型在训练集上表现良好,甚至能够达到非常高的...这表明模型学习到了训练数据中的噪声和细节,而不是数据中潜在的、具有普适性的规律。模型对训练数据“记忆”过深,导致其泛化能力(Generalization Ability)下降。
- 2020-02-20 13:20阿里开发者的博客 简介:作者 | 秦江杰 去年11月的 Flink Forward Asia 2019 上Flink 社区提出了未来发展的几个...在这种情况下, Flink将怎样拥抱AI,又会为用户带来什么新的价值?Flink AI 的优劣势分别在哪里?本文将通过对...
- 2022-07-27 18:22晴天qt01的博客 我们训练一个普通深度学习网络(Deep Nural Networks DNN)的时候很难一帆风顺,直接达到最好结果,这里对各种学习效果不好情况,提供对策。
- 2025-01-15 14:13和老莫一起学AI的博客 大语言模型是一类基于深度学习的人工智能模型,旨在处理和生成自然语言文本。通过训练于大规模文本数据,使得大语言模型能够理解并生成与人类语言相似的文本,执行各类自然语言处理任务。LLM的训练及使用LLM能够理解...
- 2025-09-01 02:08初恋是一滩水Null的博客 本文探讨了机器学习成功的关键因素,重点强调了高级数据准备和特征工程的重要性。文章分析了手动和自动化特征工程的优劣势...通过这些内容,读者可以更好地理解如何在实际项目中优化数据和模型,以提升机器学习的效果。
- 2025-07-30 17:52行云流水AI笔记的博客 NL2SQL中GRPO训练的准确率下降,本质是“数据-模型-训练策略”不匹配的结果。
- 2025-07-28 02:23程序员光剑的博客 这个AI模型上周还好好的,今天怎么预测准确率掉了15%?”“新增的用户行为数据一接入,整个训练流程就卡住了!”“想加个多语言支持,结果数据预处理模块和模型推理模块全报错…”如果你是AI系统开发者,这些"崩溃...
- 2018-04-22 10:55一个处女座的程序猿的博客 AI:人工智能的简介之AI领域基础概念术语解释之《Google发布机器学习术语表 (中英对照)》、机器学习、深度学习、数据挖掘中常见关键词、参数等5000多个单词中英文对照(绝对干货) 目录 机器学习术语表
- 2025-01-05 20:54STLearner的博客 2024年就要结束了,对今年在时空数据挖掘领域的工作进行了一次回顾,旨在总结今年时空领域的主要进展。总体而言,和23年总结一样,2024年的时空数据挖掘不仅在传统任务上继续取得进展(这部分不再赘述),而且还涌现...
- 2025-08-01 14:48AI移动开发前沿的博客 关键词:AI平台治理 | 数据质量工程 | 智能标注系统 | Apache Atlas | Great Expectations | 数据血缘 | ML流水线 | 元数据管理在智能研发平台中,高质量数据是模型性能的基石,而有效的数据治理则是保障AI研发效率...
- 2025-07-06 01:06AGI大模型与大数据研究院的博客 想象一下,你是一位怀揣游戏梦的独立开发者。你脑海里有一个精彩的游戏世界:有会说话的森林精灵、机械与血肉融合的赏金猎人、能在时空中穿梭的魔法师……但当你准备把这些角色画出来时,却发现自己的绘画水平还停留...
- 2021-10-28 18:14WGS.的博客 马尔科夫链 隐马尔科夫(HMM) 什么样的问题需要HMM HMM模型的定义 一个HMM模型实例 HMM模型的三个基本问题 前言 原创不易,转载请注明出处 机器学习中关于解决回归问题的总结 注:以下线性回归中,均可采用梯度下降、...
- 没有解决我的问题, 去提问