深度学习,做水果照片数据集,怎么制作好的数据集呢?需要对照片进行数据标注吗?vgg16模型防止过拟合大概得多少张照片
3条回答 默认 最新
技术专家团-Joel 2022-03-07 20:05关注你好,利用matlab进行深度学习的时候,数据集可以把同一个label的图片放在同一个文件夹下面,文件夹的名字就是label的名字,比如建立名叫苹果的文件夹,然后把所以属于苹果的照片都放进去,香蕉的放一个文件夹,这样不需要每一张图片都去打标签。
在训练的时候,数据集的导入用 imageDatastore函数就可以,标签来源设置为文件夹名字,具体可以看matlab帮助文档Datastore for image data - MATLAB Use an ImageDatastore object to manage a collection of image files, where each individual image fits in memory, but the entire collection of images does not necessarily fit. https://www.mathworks.com/help/releases/R2020a/matlab/ref/matlab.io.datastore.imagedatastore.htmlimds = imageDatastore('你的所有分类的文件夹所在的那个文件夹名字',... 'IncludeSubfolders',true,'FileExtensions','.tif','LabelSource','foldernames')vgg16可以处理上千万图片的上千类的分类问题,但是训练储存的权值就高达500Mb,如果你的图片数量太少,需要设置dropout来防止过拟合。事实是,四五千张图片,5个类别的数据集都有人拿来分类,效果也不错,防止过拟合的话,要么设置dropout,要么把神经网络层数减少。
解决 无用评论 打赏 举报