关注
码龄 粉丝数 原力等级 --
- 被采纳
- 被点赞
- 采纳率
模型训练过程中,accuracy会突然下降然后又恢复到原来的趋势,这是什么原因造成的呢?
收起
- 写回答
- 好问题 0 提建议
- 关注问题
微信扫一扫点击复制链接分享
- 邀请回答
- 编辑 收藏 删除 结题
- 收藏 举报
5条回答 默认 最新
- 关注
码龄 粉丝数 原力等级 --
- 被采纳
- 被点赞
- 采纳率
threenewbee 2019-04-24 11:24关注这很正常,说明某个神经元对权重有突变的显著的影响。
本回答被题主选为最佳回答 , 对您是否有帮助呢? 本回答被专家选为最佳回答 , 对您是否有帮助呢? 本回答被题主和专家选为最佳回答 , 对您是否有帮助呢?评论 打赏解决 2无用举报
微信扫一扫点击复制链接分享
评论按下Enter换行,Ctrl+Enter发表内容
报告相同问题?
提交
- 2025-03-18 20:55CarlowZJ的博客 在机器学习项目中,模型训练只是第一步,将训练好的模型部署到生产环境中,为用户提供服务才是最终目标。模型部署涉及到多个环节,包括模型保存、加载、服务化和监控。本文将从模型部署的基本概念出发,介绍常用的...
- 2024-09-04 20:35小北的北的博客 点击下方卡片,关注“小白玩转Python”公众号就像船长依赖仪器来保持航向一样,数据科学家需要回调和日志记录系统来监控和指导他们在PyTorch中的模型训练。在本教程中,我们将指导您实现回调和日志记录功能,以成功...
- 2025-02-26 11:09程序员鑫港的博客 在现代机器学习与深度学习的应用中,模型训练是实现智能决策和预测能力的核心步骤。无论是在图像分类、自然语言处理,还是在语音识别、推荐系统等领域,模型训练流程的掌握和优化直接决定了模型的性能表现。在本文中...
- 2025-12-17 16:05人工智能教程的博客 TensorBoard是TensorFlow官方提供的可视化工具,能帮助开发者直观监控AI模型的训练过程。它通过记录loss、accuracy、梯度等关键指标,并生成交互式图表,让用户快速发现过拟合、梯度消失等问题。文章详细介绍了...
- 2025-07-08 22:26AI智能探索者的博客 人工智能(AI): 模拟人类智能的计算机系统,能够执行通常需要人类智能的任务DeepSeek: 专注于深度知识检索和理解的大语言模型大语言模型(LLM): 能够理解和生成人类语言的AI模型核心概念回顾人工智能是模拟人类智能的...
- 2024-09-24 09:30Hello.Reader的博客 在现代机器学习与深度学习的应用中,模型训练是实现智能决策和预测能力的核心步骤。无论是在图像分类、自然语言处理,还是在语音识别、推荐系统等领域,模型训练流程的掌握和优化直接决定了模型的性能表现。在本文中...
- 2025-12-27 11:34含老司开挖掘机的博客 模型压缩并非简单瘦身,需平衡效率与精度。通过量化感知训练、剪枝微调、知识蒸馏和分层控制等手段,结合代表性校准数据与硬件适配,可有效缓解TFLite转换后的精度损失,实现小模型高性能部署。
- 2023-07-19 00:44光子AI的博客 作者:禅与计算机程序设计艺术 物流、配送、仓储等是人类社会中最重要和普遍的需求之一。目前,无论是在快递、物流...如何设计一个高效、智能、用户体验良好且节省成本的物流和配送系统,成为当下物流行业中的重大课
- 2025-11-25 19:10AI智能探索者的博客 理论框架:轻量化的核心是平衡“精度、速度、成本”,评估指标要全面(FLOPs、latency、精度下降率);核心技术:模型设计(天生轻)、模型压缩(减肥)、模型部署(适配硬件),三者缺一不可;实践步骤:需求分析→...
- 2025-07-31 09:16光子AI的博客 故障恢复是分布式训练的核心能力:没有可靠的故障恢复机制,大规模模型训练就无法落地;Checkpoint是基础:定期保存模型状态,是故障恢复的“最后一道防线”;弹性训练是趋势:TorchElastic、TensorFlow Elastic等...
- 2025-12-12 12:38码字仙子的博客 本文介绍如何通过Llama-Factory的训练日志判断模型是否收敛,涵盖loss变化、评估指标饱和、早停机制和梯度监控等关键方法,帮助开发者避免过拟合与资源浪费,实现高效微调。
- 2023-11-07 09:16光子AI的博客 联合学习(Federated Learning)是一种机器学习方式,它可以让多个用户在同一个模型上协同训练。联合学习通过减少参与方的数据量、降低通信成本、提高资源利用率等方式,提升模型的训练效率。其目的是为了促进分布式...
- 2025-07-29 19:32AI云原生与云计算技术学院的博客 你花了一周时间研发出一道绝世美味的新菜品(训练出一个高精度模型),但厨房没有标准化的厨具(AI工具链),服务员不知道怎么上菜(部署流程),餐厅经理也没法监控菜品质量(模型性能跟踪)——最终这道菜永远只能...
- 2025-08-02 21:23光子AI的博客 智能运营平台(如实时推荐、用户画像、异常检测系统)的核心需求是**“快”**:用户点击后100ms内返回...本文的目的是解决上述问题,聚焦模型压缩技术中的剪枝和量化,讲解其原理、架构设计及在智能运营中的实战应用。
- 2024-11-05 01:14光子AI的博客 AI大模型在智能安防系统中的创新与挑战 关键词: AI大模型、智能安防、人脸识别、深度学习、隐私保护、算法公平性 摘要: 本文将深入探讨AI大模型在智能安防系统中的
- 2025-09-03 13:10AI 算法学习的博客 静态评估:依赖人工定期复盘,无法实时反映AI应用的运行状态(如模型衰减、资源瓶颈);流程固化:阶段过渡依赖标准化流程,难以适应快速变化的业务需求(如电商大促的实时推荐调整);协同缺失:各部门AI应用形成...
- 2024-12-26 04:04光子AI的博客 模型训练中的稀疏化技术应用与效果 关键词 稀疏化技术 模型训练 计算复杂度 内存消耗 人工智能 摘要 本文旨在探讨稀疏化技术在模型训练中的应用及其带来
- 2025-07-31 03:14光子AI的博客 随后通过3个实战案例(现金流预测、信贷风险评估、财务报表异常检测),展示模型从数据预处理、训练优化到部署监控的全流程;最后探讨财务AI平台的进阶方向(如可解释性、合规性、多模态融合)。目标。
- 没有解决我的问题, 去提问



