验证集的acc loss波动都很大训练集就很好

各位可以看一下这种是什么原因吗 3分类问题感觉train acc挺好的了但是val差太多了而且波动太严重了

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
CSDN-Ada助手 CSDN-AI 官方账号 2023-03-11 22:40
关注
请看👉 ：验证集loss为什么比训练集loss小？
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

验证集 loss突然比训练集 loss 低，但此时验证集acc曲线突然比训练集的高，这是什么原因
2024-09-01 19:55

小小星125的博客如果训练集和验证集的样本分布存在差异，可能会导致这种情况。例如，验证集可能包含较容易分类的样本，而训练集可能包含较困难的样本，导致验证集的损失低于训练集的损失，而准确率则较高。：在训练过程中，某些超...
小样本中，训练集和验证集的loss和acc曲线如何变得平缓
2024-09-01 20:07

小小星125的博客在小样本情况下，训练集和验证集的损失（loss）及准确率（accuracy）曲线可能会表现得较为波动，因为样本数量较少，模型的训练过程可能会受限于数据的偶然性和噪声。
如何看网络训练中的Loss曲线和Acc曲线
2025-06-08 10:19

文弱_书生的博客训练中的Loss图像和Acc图像怎么看？怎么分析？学习率该怎么选择和调整？
【LLM】大模型SFT技术总结（数据|训练|评估）
2024-11-04 15:58

山顶夕景的博客此外，special_token 可以用来“构造知识”，比如"喜欢"这种知识一定是 sft 阶段才会见到的，可以剔除掉 pretrain 先验知识的影响，用来验证 sft 的训练情况，比如会不会过拟合。我默认大家都知道怎么用 special_...
【深度学习——CNN】训练集准确率和测试集准确率都是1（train_acc:1.000 ,val_acc=1.000）是怎么回事？
2020-05-09 15:47

王宜宝很牛的博客 2020/5/8——5/9 参考Stack Overflow相关问题下面的回答： stackoverflow_What does it mean when training and validation ... 训练集准确率没有验证集高，上网查了一下，属于正常状况。可以再改变比例训练尝试一下。
ssd网络训练loss下降但是精度提不上去_【手把手AI项目】六、Caffe实现MobileNetSSD以及文件说明，利用自己的数据集训练模型...
2020-11-26 23:30

weixin_39905226的博客文章首发于我的个人博客【【手把手AI项目】六、Caffe实现MobileNetSSD以及各个文件的具体解释，利用自己的数据集dataset训练MobileNetSSD建立模型blog.csdn.net喜欢手机观看的朋友也可以在我的个人公号：AI蜗牛...
51c大模型~合集157
2025-07-21 19:59

whaosoft-143的博客有趣的是，研究者发现，仅仅为一条文本攻击提示加上一张图片，就可能让模型的拒绝反应变得延迟，原本中层就能激活的拒绝信号被 “推迟” 到了后层，整体响应强度也降低，从而削弱了模型的安全防护能力。
二、模型训练与优化（2）：模型训练结果分析
2025-01-08 23:04

魂兮-龙游的博客在模型完成训练之后，会得到若干评估指标（如损失、准确率），以及训练过程中产生的一系列数据（训练损失、训练准确率、验证损失、验证准确率等）。对这些数据进行分析，能够帮助我们理解模型的学习情况并判断下一步...
51c大模型~合集184
2025-09-19 19:00

whaosoft-143的博客针对精准抑制大模型行为这一挑战问题，未来可进一步与强化学习算法融合，构建混合优化框架，例如利用逆学习思想高效抑制不期望行为，同时引导模型学习更优的替代策略，以填补行为抑制后的策略空缺并增强决策的鲁棒性...
51c大模型~合集174
2025-08-27 11:04

whaosoft-143的博客在这一套训练范式下，GUI-Owl的框架适配能力显著提升，在没有特意训练过的Mobile-Agent-E和Agent-S2两个第三方框架下，GUI-Owl的效果都能优于Qwen2.5-VL和Seed1.5-VL这些通用模型，同时大幅领先UI-Tars这些GUI专用...
51c大模型~合集132
2025-05-27 18:16

whaosoft-143的博客团队从数据的每个查询 x 中抽取开头词 w，然后构造相应的 SFT 数据对...该打分公式的主要思想是，模型拒绝回复的可能性越低，或者模型一直重复某个特定的输出，都表明该开头词更有可能是真实在训练数据中出现的开头词。
[教程]CNN图像分类识别+数据集制作+训练模型+预测图片+绘制准确率和loss曲线图
2022-03-19 22:18

bug生成中的博客这个专栏更新各种AI，以及各种有趣的教程，有兴趣的小伙伴可以订阅一下。首先是图片的搜集，方法无非两种一是开源的数据集，直接拿来用，另一种就是自己搜集图片制作数据集。这里我们可以通过爬虫，或是自己...
51c大模型~合集175
2025-08-28 22:25

whaosoft-143的博客 AI搜索和Web智能体通过将 LLMs 能力融入传统互联网搜索流程，能够更好地应对复杂用户问题，显著提升信息浏览与检索的效率与准确性。如图1所示，本文对近些年AI搜索相关80余篇工作进行了深入回顾。重点涵盖（1）基于...
51c大模型~合集151
2025-07-08 15:57

whaosoft-143的博客说实话，学生们感受到的压力更大。KAG 框架 V0.8 版本为 Thinker 模型应用提供支持，融入 KAG 框架后的 Thinker 模型， Math、Deduce 都使用框架中的求解器进行求解，再用 Thinker 模型进行答案汇总，可以看到 KAG-...
51c大模型~合集112
2025-02-09 22:17

whaosoft-143的博客他们在 Stable Diffusion，DiT，VAR，LlamaGen，MAR 五个截然不同的视觉架构上进行了验证，一致发现新方法性能与 CFG 相当，而采样成本减半。在图 5 中，他们展示了基于参数量的不同大小的 Gemini 的学习曲线。更快...
新手小白的，Python人工智能的学习，pytorch的学习
2024-08-12 20:07

无限进步呀的博客 TensorBoard是一个用于可视化和监控深度学习模型训练过程的工具。通过图形化的界面，开发者可以直观地看到模型的训练过程、数据的流动以及各种统计信息，从而更好地调试和优化模型。
大语言模型应用指南：从人工智能的起源到大语言模型
2024-06-27 01:03

程序员光剑的博客 人工智能（Artificial Intelligence，AI）自诞生以来，一直是计算机科学领域的重要研究方向。早期的AI系统主要依赖于专家知识和规则库，通过逻辑推理和符号计算来解决问题。然而，这种基于规则的系统在处理复杂和...
51c大模型~合集82
2024-12-01 22:33

whaosoft-143的博客马斯克的律师团队声称会对市场造成「无可挽回的伤害」（irreparable harm），禁止OpenAI的非营利性质变更后，OpenAI在继续接受新投资的情况下，「几乎不可能撤销」公司的交易，也就不会造成「大规模投资损失」。...
51c大模型~合集12
2024-11-02 22:00

whaosoft-143的博客本文探讨了新颖的基于LLM的多智能体框架中潜在的知识传播风险。为此，本文针对LLM对世界知识认知的脆弱性提出了一种两阶段的攻击框架，通过说服性植入和编造知识植入，使得被操纵的智能体在没有外部提示的情况下能够...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 3月11日

验证集的acc loss波动都很大 训练集就很好

2条回答 默认 最新

问题事件

验证集的acc loss波动都很大训练集就很好

2条回答默认最新