验证集的accuracy和loss波动幅度特别大，这是怎么回事呢？

在Keras中训练网络时，训练集的accuracy和loss很平稳，但验证集的accuracy和loss波动幅度特别大，这是怎么回事呢？

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

9条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
蹦蹦哒哒楠 2020-08-30 21:22
关注
你好，请问你最终这个问题是怎么解决的呢，我也做的是三分类，同样出现了这种情况，训练集和测试集都各自打乱了

解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

小样本中，训练集和验证集的loss和acc曲线如何变得平缓
2024-09-01 20:07

小小星125的博客在小样本情况下，训练集和验证集的损失（loss）及准确率（accuracy）曲线可能会表现得较为波动，因为样本数量较少，模型的训练过程可能会受限于数据的偶然性和噪声。
机器人和AI大模型的结合：如何打造智能化的物流和配送解决方案？
2023-07-19 00:44

光子AI的博客作者：禅与计算机程序设计艺术物流、配送、仓储等是人类社会中最重要和普遍的需求之一。目前，无论是在快递、物流...如何设计一个高效、智能、用户体验良好且节省成本的物流和配送系统，成为当下物流行业中的重大课
cnn 验证集 参与训练吗_如何正确使用机器学习中的训练集、验证集和测试集？...
2020-11-24 07:11

weixin_39955700的博客训练集、验证集和测试集，林林总总的数据集合类型，到底该怎么选、怎么用？看过这篇教程后，你就能游刃有余地处理它们了。问题审稿的时候，不止一次，我遇到作者错误使用数据集合跑模型准确率，并和他人成果比较的...
模型效果波动大？这10个技巧，帮你稳定效果，释放压力
2025-09-14 20:22

AI Native APP 开发前沿的博客数据是模型的“粮食”，粮食坏了，再厉害的厨师也做不出好菜。先搞定数据分布，波动问题解决一半。...但要注意“过犹不及”——正则化太强会导致欠拟合（比如dropout rate=0.9），要根据验证集效果调整。
AI项目效能评估难？这套企业级AI效能度量框架，架构师人手一份
2025-07-25 01:23

光子AI的博客 AI项目，特别是企业级AI项目，其复杂性远超传统的软件工程。它不仅仅是模型的构建和训练，还涉及到数据采集与治理、特征工程、模型部署、持续监控、运维优化、以及与现有业务系统的集成等多个环节。传统的软件开发...
如何看网络训练中的Loss曲线和Acc曲线
2025-06-08 10:19

文弱_书生的博客训练中的Loss图像和Acc图像怎么看？怎么分析？学习率该怎么选择和调整？
【大模型】大模型评估指标有什么？
2025-04-22 16:14

水煮蛋不加蛋的博客大模型评估已从单一任务正确率走向多维度立体化评测体系。企业需根据自身场景构建定制化评估...随着大模型向通用人工智能迈进，评估指标将进一步融合认知科学、伦理学等跨学科方法，推动技术发展与社会价值的良性互动。
AI人工智能领域的核心算法大揭秘
2025-07-07 00:20

AIGC应用创新大全的博客 AI核心算法大揭秘：从基础原理到前沿演化的全栈解析元数据框架标题：AI核心算法大揭秘：从基础原理到前沿演化的全栈解析关键词：机器学习（监督/无监督/强化）、深度学习（CNN/RNN/Transformer）、优化算法（梯度...
14.1 模型微调实战：如何用业务数据优化大模型性能？
2025-11-16 20:40

少林码僧的博客模型微调实战摘要模型微调是将预训练大模型适配特定业务需求的关键技术。预训练模型虽然具备通用能力，但往往缺乏领域专业知识、行业术语理解和业务风格匹配。通过微调，可用少量业务数据优化模型性能。微调方法...
【AI小项目6】QLoRA针对资源受限设备上的大模型微调和文本分类任务的推理
2024-09-19 21:06

AI完全体的博客本项目使用QLoRA技术（即结合了量化和 LoRA 技术），旨在在资源有限的情况下对预训练大模型进行高效微调，如移动设备或嵌入式设备，并将微调后的模型用在了一个文本分类任务的推理上。包含了完整的训练和推理过程。
解锁AI人工智能领域量化学习的实用技巧
2025-05-26 20:34

AIGC应用创新大全的博客你是否遇到过这样的困惑：明明按照教程写了训练代码，模型却总是"学不会"？...本文将聚焦AI学习中的可量化指标和可操作技巧，覆盖数据、模型、训练策略三大核心环节，帮你从"凭感觉调参"升级为"用数据说话"。
智慧城市AI模型漂移？AI应用架构师的在线学习优化策略
2025-07-28 18:27

AI应用开发实战派的博客本文聚焦智慧城市场景下的AI模型漂移问题模型漂移是什么？为什么在智慧城市里特别严重？在线学习如何解决模型漂移？AI架构师需要哪些具体策略，才能让模型“越用越聪明”？范围覆盖交通、安防、政务、环保等典型智慧...
k3估计的KL散度那么不好，为什么GRPO还要坚持用呢？
2025-04-15 16:51

具身机器人曾小健的博客首先，pretrain和sft虽然都用的crossentropy loss，但是呢，由于01 label的存在，实际上，损失函数可以写为,，num_generation设置的都是6，而KL惩罚项的beta设置成了0.04，这个0.04是。，但这里故意设置这么高，我们...
AI应用架构师复盘：社区健康管理AI智能体的架构迭代过程
2025-08-06 22:50

光子AI的博客生态整合效果：智能体与3个社区...社区健康管理AI智能体的架构迭代过程，是“技术驱动需求，需求推动技术”的典型案例。从V1.0的原型验证，到V4.0的生态融合，我们始终围绕“解决真实痛点”的核心目标，不断优化架构。
智能制造中的工业大数据分析实践
2024-04-04 11:18

光子AI的博客随着工业4.0时代的到来，智能制造成为全球...本文对智能制造中的工业大数据分析实践进行了深入探讨，介绍了工业大数据分析的基本概念、关键技术、应用场景、算法原理、数学模型、项目实践、实际应用和未来发展趋势。
AI应用架构师必看！企业AI效能度量框架从0到1搭建实战指南
2026-01-04 01:17

光子AI的博客 AI效能（AI Efficacy）是指AI系统在全生命周期中，以可控成本、可接受风险，高效达成业务目标的能力。目标模糊性：传统软件以"功能实现"为核心，而AI系统常以"预测准确率""推荐点击率"等概率性指标为目标，难以直接...
大模型训练监控怎么做？Llama-Factory内置Metrics全曝光
2025-12-12 12:06

seiji morisako的博客 Factory内置的训练监控体系，涵盖指标采集、数据聚合与可视化三层架构，重点介绍在LoRA/QLoRA微调场景下的关键监控策略，并通过实战案例展示如何利用metrics快速定位loss震荡、显存溢出等问题，提升大模型训练的可...
AI智能体如何识别并利用市场错误定价
2025-02-20 14:37

光子AI的博客市场错误定价指的是商品或服务的定价与其真实价值不符的情况。这种错误可能是由于信息不对称、市场波动、参与者行为偏差等多种因素造成...AI智能体识别市场错误定价的系统设计需要考虑市场环境的复杂性和数据的实时性。
没有解决我的问题, 去提问

验证集的accuracy和loss波动幅度特别大，这是怎么回事呢？

9条回答 默认 最新

9条回答默认最新