xfjjs江城子 2018-11-19 12:22 采纳率: 100%
浏览 5282
已结题

图像分类中数据集的问题

目前在学习图像分类,用过MNIST的数据集,格式是.npz,用过cifar-10,格式是好几个
(data_batch)
我想问的是,我自己有整理的数据集,有10个种类的文件夹,每个文件夹里对应的图片,我这种如何预处理?要不要也改成像MNIST那样的格式?那种格式怎么弄的?为什么那么弄?求解图片说明

  • 写回答

3条回答 默认 最新

  • threenewbee 2018-11-19 12:42
    关注

    你的图看不到,预处理取决于你的模型的输入,或者反过来说,你的模型的输入要和你的数据一致。
    因为看不到图,我不知道你说的现在的图片是什么样的,但是一般来说,你需要在预处理中做以下几条:
    (1)不要用jpg png这些格式,统一转换为bmp,相同的颜色深度
    (2)最好将图片缩放、裁剪成为统一的长宽高度,并且,为了性能的考虑,图片的大小在不影响识别率的前提下,越小越好
    (3)实际上bmp的头部也是不需要的,可以进一步转换为只有像素点的[x,y,3]形式的数据,x y是图片的长宽,而3表示r g b三个分量的值
    (4)建议你文件名也用有意义的名字,比如说分类的标签,这样主程序操作起来比较方便

    评论

报告相同问题?