小ccccc 2023-04-11 19:56 采纳率: 100%
浏览 24
已结题

深度学习中不进行数据增强的验证集应如何做数据划分

深度学习中训练集需要数据增强,验证集和测试集不需要做数据增强,但是如果我的数据(小数据集1000个样本)按照700:300比例分配了训练集和验证集,再对700个训练集的样本进行数据增强(比如增强到2400张图片),训练集和验证集的比例2400:300这样分配合理吗,还是就应该这样分呢,不是要保证一定的比例吗,谢谢。
  • 写回答

2条回答 默认 最新

  • 小ccccc 2023-04-11 20:30
    关注

    回答:1、验证集和测试集不需要扩充,数据扩充指针对训练集。

           2、比例指的是对原始数据划分的比例,不考虑增强后的。
    
           3、首先要明白做数据增强的意义,是为了利用现有训练集的数据,通过增强变换获得更丰富的信息,从而在测试集(验证机)上获得更好的泛化能力;
    
           4、如果先做增强再进行数据集的划分,那么会出现信息泄露的问题,导致同一张图片增强后的多张图片分别出现在训练集和测试集(验证集),那么由于在训练集里见过相似度很高的图片,测试(验证)的准确率就会很高,这时的测试准确率结果是不可靠的。
    
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

问题事件

  • 系统已结题 4月19日
  • 已采纳回答 4月11日
  • 创建了问题 4月11日

悬赏问题

  • ¥15 AIC3204的示例代码有吗,想用AIC3204测量血氧,找不到相关的代码。
  • ¥20 CST怎么把天线放在座椅环境中并仿真
  • ¥15 任务A:大数据平台搭建(容器环境)怎么做呢?
  • ¥15 YOLOv8obb获取边框坐标时报错AttributeError: 'NoneType' object has no attribute 'xywhr'
  • ¥15 r语言神经网络自变量重要性分析
  • ¥15 基于双目测规则物体尺寸
  • ¥15 wegame打不开英雄联盟
  • ¥15 公司的电脑,win10系统自带远程协助,访问家里个人电脑,提示出现内部错误,各种常规的设置都已经尝试,感觉公司对此功能进行了限制(我们是集团公司)
  • ¥15 救!ENVI5.6深度学习初始化模型报错怎么办?
  • ¥30 eclipse开启服务后,网页无法打开