最近在NLP领域做研究，应用十折交叉验证时遇到以下疑惑，求大佬们解惑？

当有训练集、验证集和测试集的时候，可以通过验证集来监控模型是否发生过拟合，以及时停止训练，而测试集是用来评估最终模型泛化能力。当使用十折交叉验证后，九成的数据用作训练集，一成的数据用作验证集，在训练的过程中，是不是当验证集的准确率收敛后就可以停止训练呢？（我现在的做法就是这样的）
当模型应用十折交叉验证跑完后，会得到10个不同验证集的准确率。我是最后计算不同模型的10个验证集的平均准确率，选择平均准确率最高的模型作为最终模型，这样可以吗？（我看网上有的说是选择具有最小泛化误差的模型作为最终模型，不知道是应该选择最小泛化误差还是最大平均准确率）
当确定最终模型后，使用全部数据作为训练集进行训练，那么在没有验证集的情况下，如何确定epoch使得模型结果不会过拟合呢？是在每次epoch训练后，通过训练集本身的准确率是否已经收敛来及时停下吗（我感觉这样做比较容易过拟合，因此我现在的做法是在刚好超过使用十折交叉验证时验证集的平均准确率的时候就停了下来）？
对我们的原始数据集进行了四种不同的处理（或者说划分）：random、expert、bundle和table，处理后使用十折交叉验证，发现random方法下，在验证集准确率收敛后，其准确率有0.88左右，训练集的准确率可以达到0.96以上，这是不是算是过拟合呢？
使用同样的超参数（如learning rate，epoch，batch size，dropout rate等都一样），在expert等其他三种划分下，在验证集准确率收敛后，其准确率只有0.68左右，但训练集的准确率依旧可达0.96以上，这是明显的过拟合吗？0.68的准确率能反应这个数据集在这种情况下划分的泛化能力吗？

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
dabocaiqq 2020-04-15 09:56
关注
https://blog.csdn.net/jp_zhou256/article/details/85248578

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

请问chatGPT在IT领域能够做出哪些显著的贡献？或者说有哪些特别抢眼的应用？尤其是在计算机，通信领域。网络协议自然语言处理语言模型
2023-02-17 22:23

回答 2 已采纳方案来自梦想橡皮擦狂飙组基于 GPT 编写的 “程秘” 作为一个大语言模型，ChatGPT在自然语言处理领域具有巨大的潜力，包括但不限于：自然语言生成：ChatGPT可以用于生成高质量的自然语
平台如何调用底层算法库的，求大佬帮忙解惑。 c++ 深度学习自然语言处理
2020-01-07 10:40

回答 1 已采纳你的问题可分解为两个问题： 1 开发语言之间互调 1.1 java调c++ 1.2 c++调java 1.3 c++调python 1.4 python调c++
如何写一个通用人工智能软件？人工智能深度学习自然语言处理
2022-03-31 15:18

回答 4 已采纳目前我们还达不到强人工智能，你说的这些暂时还没有办法实现。
AI测试干货！实例讲解AI自动生成测试用例
2024-04-18 19:07

测试那些事的博客在软件开发过程中，测试用例的生成是至关重要的一步。测试用例是用于验证软件功能、性能和安全性的具体测试方法，是确保软件质量的关键...随着人工智能（AI）技术的发展，基于 AI 的测试用例生成技术逐渐成为未来趋势。
如何结合计算机视觉和自然语言处理还有3D建模，实现输入句子生成短视频 3D电影 3D模型？人工智能自然语言处理计算机视觉
2022-03-31 16:27

回答 1 已采纳给你道，要求能生成万物。
求大佬分析一下高等数学提纲，并参照提纲给点学习建议。谢谢人工智能多彩生活职场和发展自然语言处理问答团队
2021-01-25 10:47

回答 2 已采纳我上课用的是同济大学的，看你的学校层次，如果比较好的话，前面三张就是划水，后面从不定积分开始才是玩的。老师会出一些应用题和牛顿-莱布尼茨公式相对应的式子，但是像前三章，虽然基础，但重要。后面的多元微
阿里Java面经大全（整合版）
2018-08-03 16:10

Java技术江湖的博客 1.上来问我项目用的框架，然后问我springmvc里面有的参数的设定，问的是细节，然后问我如果传的多个值是一个对象的属性，问我如何处理，我说直接在后端接收为对象就行了，然后突然问我http怎么传对象，这里有点不...
如何实现自然语言处理？制作一个3D游戏，内含所有的名词，形容词，动词，副词。实现输入一句话，就显示一个3D动画。语言变3D电影 python 人工智能自然语言处理
2022-03-31 18:41

回答 5 已采纳首先，你的3D模型必须自成一库，切含括绝大多数的普遍性物体和生命，亦或者将思路转化为像人物捏脸一般，通过输入的字段，通过神经网络比对和深入后返回的物体的一切特征，然后进行捏脸环节的拼接，元素化地生成每
项目需要做语音合成，哪位大佬有免费的第三方语音库呀，求求求开发语言自然语言处理
2020-04-15 09:28

回答 3 已采纳百度语音合成，免费的 https://ai.baidu.com/tech/speech/tts_online
自然语言处理中如何将超参数进行调优？自然语言处理
2022-12-14 12:44

回答 1 已采纳在划分数据集以供循环神经网络 (RNN) 使用时，通常建议使用训练集、验证集和测试集。训练集用于训练RNN，验证集用于调整RNN的超参数，测试集用于评估训练好的RNN的性能。如果您使用具有不同类型循
go技术文章精选（2019）
2020-01-03 00:52

韩亚军的博客在用户态观测 Linux 内核函数的调用情况（调用次数、入参回值、时长等） gocn_news_2019-12-23 如何调试K8s中的DNS问题 https://cilium.io/blog/2019/12/18/how-to-debug-dns-issues-in-k8s/ 在...
目前人工智能写作达到什么水平了？人工智能自然语言处理
2019-11-01 21:24

回答 1 已采纳 google下dcgan做文本生成，还有seq2seq文本序列预测的paper，这几年进步还是很大的。
详解大火的自动驾驶数据闭环与工程化问题
2023-07-08 00:00

自动驾驶之心的博客 utm_id=0点击下方卡片，关注“自动驾驶之心”公众号ADAS巨卷干货，即可获取本文只做学术分享，如有侵权，联系删文1前言关于自动驾驶的软件架构，我之前有几篇文章《智能驾驶域控制器的软件架构及实现》(上，下)，...
详解自动驾驶数据闭环与工程化
2023-07-17 07:30

自动驾驶之心的博客作者|萧猛编辑|汽车人原文链接：...联系删文前言关于自动驾驶的软件架构，我之前有几篇文章《智能驾驶域控制器的软件架构及实现》(上，下)，《中间件与SOA》(上，中，下)。这篇文章...
没有解决我的问题, 去提问

悬赏问题

¥15 素材场景中光线烘焙后灯光失效
¥15 请教一下各位，为什么我这个没有实现模拟点击
¥15 执行 virtuoso 命令后，界面没有，cadence 启动不起来
¥50 comfyui下连接animatediff节点生成视频质量非常差的原因
¥20 有关区间dp的问题求解
¥15 多电路系统共用电源的串扰问题
¥15 slam rangenet++配置
¥15 有没有研究水声通信方面的帮我改俩matlab代码
¥15 ubuntu子系统密码忘记
¥15 保护模式-系统加载-段寄存器

最近在NLP领域做研究，应用十折交叉验证时遇到以下疑惑，求大佬们解惑？

1条回答 默认 最新

悬赏问题

1条回答默认最新