m0_56675597
2022-03-10 09:49
采纳率: 57.1%
浏览 54

对于transunet中在CNN后是如何传入transform的

问题遇到的现象和发生背景

如下图

img


在CNN后,得到的应该是一个尺寸很小,通道数很多的特征信息,但是VIT的流程图如下

img


VIT传入要先切片,设patchszie等于16,N就等于HW/p平方,但是这里我看的不太明白,是对CNN后的尺寸很小的图进行切片,还是对原图进行切片,如果是CNN后的图,他的图片应该是很小的啊,在patchsize等于16时,怎么切的开啊?**
**

1条回答 默认 最新

相关推荐 更多相似问题