如题 upernet作为解码器时 将fpn的特征融合后得到原始分辨率的四分之一特征图后 下一步用的是什么解码头啊
最近在学习swintransformer 发现网上对它用的解码器很少甚至没有。。
如题 upernet作为解码器时 将fpn的特征融合后得到原始分辨率的四分之一特征图后 下一步用的是什么解码头啊
最近在学习swintransformer 发现网上对它用的解码器很少甚至没有。。
参考GPT和自己的思路:
对于upernet语义分割网络,通常采用的是FCN解码头。FCN全称为 Fully Convolutional Networks,是一种用于像素级任务的神经网络结构。FCN在网络的最后一层使用了deconvolution(反卷积)操作,将低分辨率的特征图还原至原始分辨率,以得到像素级别的预测结果。
至于Swin Transformer网络的解码器,一般采用的是类似于 FCN 的插值方式将低分辨率的特征图还原至原始分辨率,而不是使用传统的解码头。这种做法在一定程度上能够减少模型的计算量和参数数量,同时还能够提升模型的性能表现。