现有一个包含2w多张的数据集,13个类别。但是我只想要其中的两个类别。
现在的一个问题是,比如某一类的train中有5000张图片,但只有400张正样本图片。train_txt中的负样本占比约90%。
这样训练会不会存在正负样本不均衡,导致训练效果差的问题?
除了改json文件,我要训练全部的图片吗?
数据集如果只要其中的某两类?
- 写回答
- 好问题 0 提建议
- 追加酬金
- 关注问题
- 邀请回答
-
1条回答 默认 最新
- ·星辰大海 2022-09-09 10:34关注
如果要做样本均衡,可以将原来的正样本加大权重多复制一些,或者镜像,旋转,放大缩小之后在加入到样本集中,并在训练的时候关掉相关的图像预处理,也可以在不影响样本主要特征情况下用ps将正样本无关紧要的特征做修改,每次修改都可以多出一个正样本。
当然你可以不用训练全部的样本,如果分类的特征较为明显,较为简单的话,800-1000个样本足以有一个好的分类效果。本回答被题主选为最佳回答 , 对您是否有帮助呢?解决 无用评论 打赏 举报
悬赏问题
- ¥15 delta降尺度计算的一些细节,有偿
- ¥15 Arduino红外遥控代码有问题
- ¥15 数值计算离散正交多项式
- ¥30 数值计算均差系数编程
- ¥15 redis-full-check比较 两个集群的数据出错
- ¥15 Matlab编程问题
- ¥15 训练的多模态特征融合模型准确度很低怎么办
- ¥15 kylin启动报错log4j类冲突
- ¥15 超声波模块测距控制点灯,灯的闪烁很不稳定,经过调试发现测的距离偏大
- ¥15 import arcpy出现importing _arcgisscripting 找不到相关程序