阿偶~ 2023-04-10 20:09 采纳率: 11.1%
浏览 465
已结题

是先进行数据增强还是先进行数据集划分

1、如果先进行数据增强后再进行数据集划分(假设只划分训练集和验证集)那么一张亮度调节后的图片和它原图片本质上是一张图片,进行随机划分后如果两张本质相同的照片分别进入训练集和验证集这样会影响训练结果吗?

  • 写回答

6条回答 默认 最新

  • Leodong. 2023-04-10 21:08
    关注

    该回答通过自己思路及引用到GPTᴼᴾᴱᴺᴬᴵ搜索,得到内容具体如下:

    在目标检测任务中,通常建议先进行数据增强,再进行数据集划分。
    
    数据增强可以通过对原始数据进行旋转、缩放、翻转、裁剪等操作,生成更多的训练样本,增加数据的多样性和数量,提高模型的泛化能力。
    因此,数据增强可以帮助提高模型的性能,提高训练效果。
    
    数据集划分是将数据集分为训练集、验证集和测试集等,用于训练和评估模型的性能。
    通常建议采用随机划分的方法,确保每个样本都有相等的机会被分配到训练集和验证集中,避免数据集中存在偏差。
    
    对于你提到的问题,如果同一张图片被划分到训练集和验证集中,可能会导致模型的评估结果过于乐观,因为模型已经在训练数据中学习到了这张图片的特征。
    因此,在进行数据集划分时,应该确保同一张图片只被分配到一个数据集中,可以通过设置随机数种子来实现。
    另外,如果使用了数据增强技术,生成的增强图片也应该参与数据集划分,避免同一张增强图片被分配到不同的数据集中。
    

    如果以上回答对您有所帮助,点击一下采纳该答案~谢谢

    评论 编辑记录

报告相同问题?

问题事件

  • 已结题 (查看结题原因) 4月12日
  • 创建了问题 4月10日

悬赏问题

  • ¥15 stnodeeditor自定义控件
  • ¥15 SDO如何更改STM32的波特率
  • ¥15 elasticsearch
  • ¥15 uniapp的uni-datetime-picker组件在ios端不适配
  • ¥15 前端 uniapp App端在离线状态如何使用modbus 连接手机蓝牙进行读写操控机器?
  • ¥15 SQL语句根据字段自动生成行
  • ¥500 “掌声响起来”软件(不确定性人工智能)
  • ¥500 我要找大模型一体机产品手册和应用案例
  • ¥20 关于游戏c++语言代码问题
  • ¥15 如何制作永久二维码,最好是微信也可以扫开的。(相关搜索:管理系统)