各位大神好:
有三个问题哈。
第一个:在利用FCN进行图片语义分割时,比如对VGG16进行迁移学习得到最后的三层全连接层权重,我的疑问是,是不是训练的每个图片只能有类别中的一种?
比如说 需要训练的类别有:飞机、人、汽车、自行车、猫、火车六种,而我的某一训练图片既有飞机又有人,这样的图片能作为训练图片吗?
第二个:还要请教各位对FCN的理解,看了好几个文档,不知道我理解的对不对。
- 第一步:先通过迁移学习得到VGG16的最后3个全连接层的参数。
-
第二步:将全连接层权重变为相应的卷积层权重,然后修改网络结构(增加特征融合及上采样层),继续学习,得到语义分割结果。
第三个: 现在还遇到一个问题,网上下载了VOC2012数据集,但是前期需要进行图片分类操作,但是文件里面图片的标注每个文件都是一样的:
,比如说图片中aeroplane_train.txt与bicycle_train.txt里面标识的图片名称是一样的,也就是这个数据集拿来没用。
请问大家在哪里能下载到靠谱的数据标识。
不胜感激,来自一个菜鸟的纠结。