m0_56675597 2022-03-10 09:49 采纳率: 55.6%
浏览 114

对于transunet中在CNN后是如何传入transform的

问题遇到的现象和发生背景

如下图

img


在CNN后,得到的应该是一个尺寸很小,通道数很多的特征信息,但是VIT的流程图如下

img


VIT传入要先切片,设patchszie等于16,N就等于HW/p平方,但是这里我看的不太明白,是对CNN后的尺寸很小的图进行切片,还是对原图进行切片,如果是CNN后的图,他的图片应该是很小的啊,在patchsize等于16时,怎么切的开啊?**
**

  • 写回答

1条回答 默认 最新

  • Billie使劲学 2022-03-16 21:19
    关注

    我也在纠结这个问题
    你说的这个是对原图的操作
    经过CNN的还有进一步的操作
    if config.patches.get("grid") is not None: # ResNet
    grid_size = config.patches["grid"]
    patch_size = (img_size[0] // 16 // grid_size[0], img_size[1] // 16 // grid_size[1])
    patch_size_real = (patch_size[0] * 16, patch_size[1] * 16)
    n_patches = (img_size[0] // patch_size_real[0]) * (img_size[1] // patch_size_real[1])
    self.hybrid = True
    else:
    patch_size = _pair(config.patches["size"])
    n_patches = (img_size[0] // patch_size[0]) * (img_size[1] // patch_size[1])
    self.hybrid = False
    这里应该是得到一个新的patch_size
    然后结果为True,则会调用CNN模型
    if self.hybrid:
    self.hybrid_model = ResNetV2(block_units=config.resnet.num_layers, width_factor=config.resnet.width_factor)
    in_channels = self.hybrid_model.width * 16
    然后对输出的width有个*16的操作
    哈哈哈,再具体还没看明白
    要不要加个联系方式一起探讨

    评论

报告相同问题?

问题事件

  • 创建了问题 3月10日

悬赏问题

  • ¥15 如何在scanpy上做差异基因和通路富集?
  • ¥20 关于#硬件工程#的问题,请各位专家解答!
  • ¥15 关于#matlab#的问题:期望的系统闭环传递函数为G(s)=wn^2/s^2+2¢wn+wn^2阻尼系数¢=0.707,使系统具有较小的超调量
  • ¥15 FLUENT如何实现在堆积颗粒的上表面加载高斯热源
  • ¥30 截图中的mathematics程序转换成matlab
  • ¥15 动力学代码报错,维度不匹配
  • ¥15 Power query添加列问题
  • ¥50 Kubernetes&Fission&Eleasticsearch
  • ¥15 報錯:Person is not mapped,如何解決?
  • ¥15 c++头文件不能识别CDialog