现象描述
一般做小样本图像分类的数据集类别非常多(例如miniImageNet和cifar都有100类,CUB有200类,tieredImageNet更多有608类),它们根据不同的比例将数据集划分为类别不相交的train(基类,用于训练模型)、val(验证是否过拟合,调节训练参数)、test(构造support set和query图片,组成n-way k-shot的任务tasks,用于测试模型得到精度)三部分。
而现在有一个只有9类的图像数据集,按照常见的5-way 1-shot和5-way 5-shot任务,test的类别至少为5,那么train的基类类别个数自然就很少,不满足基类在划分比例中占大头的常规做法。
我的想法
A. 硬着头皮划分按照3:1:5的比例划分数据集
B. 将每个类别的图像对半分,形成18个类;再按照8:5:5的比例划分数据集
以上做法是否可行?