深度学习多分类任务如何划分数据集？

我以下主要在讨论Zero-shot Learning

我感觉现有的多任务分类的数据分法不大合理，因为验证集和测试集包含的是完全不同的classes，这很容易导致在验证集上调的参在测试集上表现很差劲，真正分高的参数却难以选择。

唯一的办法就是在验证集上调参的同时在测试集上也看看分，不然不知道模型自个跑到哪去了。但这个作法就很不标准了，几乎等同于在测试集上调参。

当然我目前只了解了视频分类领域，别的领域还不知道，是否都是这样分类的呢？

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
过好当下，希冀未来 2024-01-09 23:11
关注
一般不能根据测试集来选择模型，否则你的模型效果会过拟合。
对于分类任务（无论是否深度学习），应该尽可能让验证集和测试集的标签相同，让两者的分布也接近，这样你在验证集上的效果和测试集合效果会相对更容易一致些。你尽管通过各种方法来优化模型在验证集上的效果，优化好后，在测试集上进行测试，测试集的效果用于衡量模型的效果。

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

用深度学习做文本分类，需要多大的样本量？准备自己构建数据集，正负样本比例最大不能大于多少？ tensorflow 人工智能数据挖掘深度学习自然语言处理
2020-07-30 11:12

回答 1 已采纳这个不可一概而论。看你是在什么场景下分类，如果是特定的一些内容，比如用户简单的评价做正面负面分类，很少的样本就可以了。如果要在自然语境中无限的分类，那么就需要很大的样本。另外和你的模型、模型的
深度学习代码运行时数据集文件出现问题？ python tensorflow 有问必答深度学习
2021-05-06 14:42

回答 4 已采纳第一步先下载数据集，然后解压打开某个视频类别文件夹，如下图所示接下来看看1_move_files.py这个python文件首先看下原始仓库代码的目录结构，如下图所示运行1_
有什么长文本多分类的数据集吗?要求英文 pytorch 深度学习自然语言处理
2022-03-07 18:58

回答 2 已采纳我网盘里有，30天权限，记得拿走链接: https://pan.baidu.com/s/1pkO8hTP5M_TS7ewEzskaVQ 提取码: phbn
深度学习数据集/MegaAge-asian人脸年龄数据集/分类算法AI年龄
2024-05-25 16:11

深度学习在人工智能领域占据着核心地位，特别是在计算机视觉任务中，如人脸识别、图像分类和对象检测等。MegaAge-asian人脸年龄数据集是专为训练和评估深度学习模型而设计的一个大型数据集，尤其适合研究人脸识别中...
使用深度学习进行裂缝分割，如何标注数据？ python 深度学习
2022-04-17 17:14

回答 1 已采纳这个一般看你的网络需求输入是什么样子的，和你想要的效果是怎么样的。如果你的网络需要line的标签，或者是多边形处理成line的标签，那么直接标注line就行，反之则标注多边形。如果是效果来说，一般你标
深度学习KolektorSDD数据集和DAGM 2007数据集的使用问题 python 机器学习深度学习
2021-05-26 15:27

回答 2 已采纳都默认为单通道的图像即可如果你做分类一类是有缺陷的一类是无缺陷的；如果你做目标检测检测正样本与负样本的区别；模型训练过程中建议统一图像格式比如都是.jpg或者png 同时用可以但
深度学习中不进行数据增强的验证集应如何做数据划分机器学习深度学习
2023-04-11 19:56

回答 2 已采纳回答：1、验证集和测试集不需要扩充，数据扩充指针对训练集。 2、比例指的是对原始数据划分的比例，不考虑增强后的。 3、首先要明白做数据增强的意义，是为了利用现有训练集的数
人工智能+深度学习+数据集预处理+xml转json
2022-06-10 13:49

在当前的IT领域，人工智能（AI）和深度学习（Deep Learning...总的来说，这个项目涵盖了人工智能、深度学习、目标检测、数据集处理以及XML到JSON转换等多个重要知识点，是理解和实践现代计算机视觉技术的一个实用案例。
如何入门机器学习/深度学习进行大数据分析？机器学习深度学习自然语言处理
2022-10-12 12:55

回答 1 已采纳先学理论，实现的时候顺带学习python，这样的话python就会不知不觉中学会了。当然，你也可以先学一些基础的python语法，做一些简单的小实验，然后在开始理论的学习。机器学习的话基本上吴恩达的视
多标签分类数据集问题——如果训练集中多标签图像很少，多标签分类是否可行？图像处理机器学习深度学习
2022-05-24 18:07

回答 3 已采纳 1、训练集中大部分图像只包含一种动物，只要整个训练集能较好的覆盖所要分类的动物种类，就可以进行分类。如果大部分图像都是某一种动物——猫，而其它种类动物的样本都很少，则训练效果不好。如果虽然每张图片中包
学习深度学习，在构建数据集的时候遇到的问题 python pytorch 深度学习
2023-04-05 09:46

回答 1 已采纳你的inint是不是拼错了
深度学习中的数据集与分类任务
2024-01-18 02:08

光剑书架上的书的博客 深度学习是一种人工智能技术，它通过模拟人类大脑中的神经网络来解决复杂的问题。在过去的几年里，深度学习已经取得了显著的成功，例如在图像识别、自然语言处理、语音识别等领域。这些成功的应用使得深度学习成为了...
LSTM模型可以训练怎样的数据集？人工智能深度学习神经网络自然语言处理
2020-04-18 17:08

回答 1 已采纳 LSTM主要用来学习序列，并且序列的变化的影响因子和序列本身有关或者周期性波动。比如说文本预测，每天每周每年的销量别的也可以学，但是效果未必很好。
深度学习开源数据集分类汇总.pdf
2023-04-27 15:11

本资料“深度学习开源数据集分类汇总.pdf”提供了21个深度学习相关的开源数据集信息，涵盖了多个领域的应用。 1. 图像识别与计算机视觉：这些数据集包括MNIST（手写数字识别）、CIFAR-10/100（小规模图像分类）、...
人工智能 深度学习 cifar100 数据集
2022-04-07 11:59

在IT领域，人工智能（AI）和深度学习是两个极为重要的概念，它们正在革新我们的世界。...通过理解和利用这个数据集，我们可以更好地理解和提升深度学习模型在图像识别任务上的性能，为未来的人工智能技术打下坚实基础。
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 1月9日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 1月9日

悬赏问题

¥15 求ax+by=n的正整数解
¥50 使用MS Log Parser查询使用Bitvise SSH Server登录的IP
¥20 校园二手交易小程序搭建
¥15 请问在ubuntu用conda创建环境报错怎么能解决
¥15 STM32CubeMX/proteus按键控制指示灯颜色切换
¥20 python，计算区位熵和扩张指数
¥15 Python环境配置
¥15 大四学生的困惑，有偿提问！
¥15 解决页面无法编入索引：被“noindex”标签排除的问题？
¥15 arduino测量电阻

深度学习多分类任务如何划分数据集？

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新