LL YANG 2022-09-09 10:25 采纳率: 29.4%
浏览 20
已结题

数据集如果只要其中的某两类?

现有一个包含2w多张的数据集,13个类别。但是我只想要其中的两个类别。
现在的一个问题是,比如某一类的train中有5000张图片,但只有400张正样本图片。train_txt中的负样本占比约90%。
这样训练会不会存在正负样本不均衡,导致训练效果差的问题?
除了改json文件,我要训练全部的图片吗?

  • 写回答

1条回答 默认 最新

  • ·星辰大海 2022-09-09 10:34
    关注

    如果要做样本均衡,可以将原来的正样本加大权重多复制一些,或者镜像,旋转,放大缩小之后在加入到样本集中,并在训练的时候关掉相关的图像预处理,也可以在不影响样本主要特征情况下用ps将正样本无关紧要的特征做修改,每次修改都可以多出一个正样本。
    当然你可以不用训练全部的样本,如果分类的特征较为明显,较为简单的话,800-1000个样本足以有一个好的分类效果。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

问题事件

  • 系统已结题 10月17日
  • 已采纳回答 10月9日
  • 创建了问题 9月9日

悬赏问题

  • ¥15 delta降尺度计算的一些细节,有偿
  • ¥15 Arduino红外遥控代码有问题
  • ¥15 数值计算离散正交多项式
  • ¥30 数值计算均差系数编程
  • ¥15 redis-full-check比较 两个集群的数据出错
  • ¥15 Matlab编程问题
  • ¥15 训练的多模态特征融合模型准确度很低怎么办
  • ¥15 kylin启动报错log4j类冲突
  • ¥15 超声波模块测距控制点灯,灯的闪烁很不稳定,经过调试发现测的距离偏大
  • ¥15 import arcpy出现importing _arcgisscripting 找不到相关程序