关注
码龄
粉丝数
原力等级 --
被采纳
被点赞
采纳率
一秋606
2021-05-10 23:51
采纳率: 0%
浏览 32
首页
人工智能
在训练集上归一化损失尚未收敛至0,但此时已在测试集上有良好的f1值,算模型训练成功了吗?
机器学习
如上图,请问epoch等于多少时才算模型训练成功呢?
收起
写回答
好问题
0
提建议
关注问题
微信扫一扫
点击复制链接
分享
邀请回答
编辑
收藏
删除
结题
收藏
举报
1
条回答
默认
最新
关注
码龄
粉丝数
原力等级 --
被采纳
被点赞
采纳率
kay_545
优质创作者: 人工智能技术领域
2024-05-18 09:40
关注
是,loss很少会收敛到0,一般是只是接近0
本回答被题主选为最佳回答
, 对您是否有帮助呢?
本回答被专家选为最佳回答
, 对您是否有帮助呢?
本回答被题主和专家选为最佳回答
, 对您是否有帮助呢?
解决
无用
评论
打赏
微信扫一扫
点击复制链接
分享
举报
评论
按下Enter换行,Ctrl+Enter发表内容
查看更多回答(0条)
向“C知道”追问
报告相同问题?
提交
关注问题
标准化,
归一化
与
训练
-
测试集
数据处理
2021-02-20 12:11
Shian150629的博客
标准化,
归一化
的区别数据预处理的
归一化
手段应该如何应用到
训练集
,
测试集
和验证集中?问题:回答1:回答2问题3回答1回答2问题4回答1 1. 标准化,
归一化
的区别 作者:宝珠道人 链接:...
神经网络
测试集
loss不变_神经网络
训练
过程中不
收敛
或者
训练
失败的原因
2020-12-01 07:55
weixin_39737233的博客
在面对
模型
不
收敛
的时候,首先要保证
训练
的次数够多。在
训练
过程中,loss并不是一直在下降,准确率一直在提升的,会有一些震荡存在。只要总体趋势是在
收敛
就行。若
训练
次数够多(一般上千次,上万次,或者几十个...
用VGG 16
训练
数据集并保存
模型
测试效果+Tensorboard可视化
收敛
曲线
2019-06-18 14:40
JstartTang的博客
楼主深度学习入门小白白一只,在CSDN 摸怕滚打一圈才知道
训练
数据是个什么东西!!!! Emmmm 总之用我们家大佬一句换概括就是炼丹!!过程是枯燥的!但是结果是令人欣喜的! ** <一>准备工作!!! ** ...
深度学习
模型
训练
时
损失
在下降但是波动较大_深度学习知识点总结四(防止过拟合的方法)...
2020-12-06 00:20
weixin_39578516的博客
之所以过拟合,其实就是因为
模型
本身见到的数据太少了,比如对于猫这类动物,如果
训练
数据集中只有一个正拍且坐立的猫,那么当过拟合时,
模型
往往有可能只能识别出这类姿态的猫,像跳跃的猫、局部捕捉的猫、反转的猫...
一文通透让Meta恐慌的DeepSeek-V3:在MoE、GRPO、MLA基础上提出Multi-Token预测(含FP8
训练
详解)
2025-01-27 09:00
v_JULY_v的博客
他们的MTP策略主要旨在提高主
模型
的性能,因此在推理过程中,可以直接丢弃MTP模块,主
模型
可以独立正常运行此外,还可以重新利用这些MTP模块进行推测性解码,以进一步提高生成延迟// 待更。
自回归版π0-FAST——打造高效Tokenizer:比扩散π0的
训练
速度快5倍但效果相当(含π0-FAST源码剖析)
2025-02-06 15:58
v_JULY_v的博客
最近,多项研究开发了通用机器人策略[这些策略是在越来越大的机器人学习数据集,比如52-Open-X上进行
训练
的
训练
通用策略的一种有前途的方法是视觉-语言-动作
模型
VLAs,包括且不限于10Rt-239-Openvla7-π063-Tinyvla...
Python从0到100(九十):UCI-HAR数据集深度剖析和
训练
仿真(文末送书)
2025-03-04 09:31
是Dream呀的博客
本文系统性地阐述了从数据预处理到深度神经网络建模的全流程解决方案,以UCI-HAR数据集为研究对象,通过Python实现多维时间序列信号的智能解析,融合了信号处理技术与卷积神经网络(CNN),构建了端到端的人类活动...
从LongLoRA到LongQLoRA(含源码剖析):超长上下文大
模型
的高效微调方法
2024-01-04 00:06
v_JULY_v的博客
本文一开始是《七月论文审稿GPT第2版:从Meta Nougat、GPT4审稿到Mistral、LongLora Llama》中4.3节的内容,但一方面考虑到LongLora的实用性,二方面为了把LongLora和LongQLora更好的写清楚,故把这部分的内容抽取...
【已解决】使用keras对resnet, inception3进行fine-tune出现
训练集
准确率很高但验证集很低的问题(BN)
2019-07-02 21:18
wf592523813的博客
通过查看github和博客发现是由于BN层导致的,国外已经有人总结并提了一个PR(虽然并没有被merge到Keras官方库中),并写了一篇博客,也看到知乎有人翻译了一遍:Keras的BN你真的冻结对了吗 当保存
模型
后再加载
模型
去...
多分类LSTM
训练集
和
测试集
准确率差别很大
2022-01-23 00:02
倒颠市城.的博客
归一化
参数影响
测试集
准确率
没有解决我的问题,
去提问
向专家提问
向AI提问
付费问答(悬赏)服务下线公告
◇ 用户帮助中心
◇ 新手如何提问
◇ 奖惩公告