对于transunet中在CNN后是如何传入transform的

问题遇到的现象和发生背景

如下图

在CNN后，得到的应该是一个尺寸很小，通道数很多的特征信息，但是VIT的流程图如下

VIT传入要先切片，设patchszie等于16，N就等于HW/p平方，但是这里我看的不太明白，是对CNN后的尺寸很小的图进行切片，还是对原图进行切片，如果是CNN后的图，他的图片应该是很小的啊，在patchsize等于16时，怎么切的开啊？**
**

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
Billie使劲学 2022-03-16 21:19
关注
我也在纠结这个问题
你说的这个是对原图的操作
经过CNN的还有进一步的操作
if config.patches.get("grid") is not None: # ResNet
grid_size = config.patches["grid"]
patch_size = (img_size[0] // 16 // grid_size[0], img_size[1] // 16 // grid_size[1])
patch_size_real = (patch_size[0] * 16, patch_size[1] * 16)
n_patches = (img_size[0] // patch_size_real[0]) * (img_size[1] // patch_size_real[1])
self.hybrid = True
else:
patch_size = _pair(config.patches["size"])
n_patches = (img_size[0] // patch_size[0]) * (img_size[1] // patch_size[1])
self.hybrid = False
这里应该是得到一个新的patch_size
然后结果为True，则会调用CNN模型
if self.hybrid:
self.hybrid_model = ResNetV2(block_units=config.resnet.num_layers, width_factor=config.resnet.width_factor)
in_channels = self.hybrid_model.width * 16
然后对输出的width有个*16的操作
哈哈哈，再具体还没看明白
要不要加个联系方式一起探讨

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

transunet对于小样本效果是否不如unet cnn transformer 深度学习
2022-03-22 23:34

回答 1 已采纳越是大模型，越需要预训练，不然容易过拟合。
求解惑，cnn用在图像压缩，训练集作用是干什么的啊 cnn python 深度学习
2023-04-04 18:38

回答 2 已采纳不知道你这个问题是否已经解决, 如果还没有解决的话: 这个问题的回答你可以参考下: https://ask.csdn.net/questions/7427258这篇博客你也可以参考下：浏览器上实现CN
在pytorch中，使用cnn+lstm用于分类 python 有问必答深度学习神经网络
2021-05-29 00:45

回答 2 已采纳可以参考这篇文章，希望对你有帮助：pytorch实现用CNN和LSTM对文本进行分类_Alphapeople的博客-CSDN博客
TransUNet：基于 Transformer 和 CNN 的混合编码网络
2021-07-08 17:49

louwill12的博客 VisualTransformerAuthor：louwillMachine Learning Lab 在深度学习医学图像分割领域，UNet结构一直以来都牢牢占据着主导地位。自从2...
关于基于cnn的图像识别中，对于输入图像预处理的问题 tensorflow 人工智能机器学习深度学习神经网络
2019-12-18 09:11

回答 1 已采纳如果有些样本存在瑕疵（比如曝光不正确、不清晰）和别的样本不同，预处理下会更好，否则不需要。总之应该保证样本的一致性。
深度学习CNN中Lenet和优化器 cnn python 深度学习
2023-02-17 13:04

回答 3 已采纳 import torch import torchvision.models as models # 加载预训练的LeNet模型 model = models.lenet(pretrained=T
tensorflow构建cnn后summary无法显示 cnn python tensorflow
2022-07-18 18:37

回答 2 已采纳问题已经解决了，果然是芯片问题（m1芯片不能直接pip install TensorFlow），有专门的适配版本，会比较麻烦，我直接换了一个Intel芯片的电脑就可以
TransUNet
2021-07-24 20:03

不秃头不成功的博客因为CNN受感受野的缘故，始终不能很好地利用全局信息，或者说需要很多层后才能得到抽象的全局信息，但CNN对局部细节信息可以很好地提取。 transformer网络由于具有self-attention结构，所以对于全局信息的提
CNN算法中怎么使用自调节学习速率 cnn 人工智能神经网络
2018-01-21 02:40

回答 2 已采纳 >Tensorflow 自适应学习速率 https://www.cnblogs.com/crackpotisback/p/7105748.html
关于CNN图像识别模型 cnn 人工智能深度学习
2023-03-08 14:47

回答 4 已采纳参考GPT和自己的思路：以下是针对您的需求对代码进行修改的版本： import torch.nn as nn import torch.nn.functional as F # define the
encoder-decoder内，encoder层使用gru前的rnn或cnn是什么用？ python 人工智能机器学习
2021-05-24 22:51

回答 1 已采纳这个一般是根据任务特点而定的，不同的任务要根据这个任务的特点来选择网络结构。从你的问题描述，我猜测可能的情况是（以NLP任务为例）：1. 使用CNN对字向量进行卷积得到词向量，再将词向量输入到GRU中
论文解析[8] TransUNet: Transformers Make Strong Encoders for Medical Image Segmentation
2022-12-03 23:13

默_silence的博客关于TransUNet论文的论文解析，《TransUNet: Transformers Make Strong Encoders for Medical Image Segmentation》
pytorch搭建的cnn-lstm的Tensor问题 cnn python pytorch
2022-10-19 08:47

回答 1 已采纳你看下这篇博客吧, 应该有用👉 ：pytorch+cnn+lstm+词向量
Swin-Unet：Swin Transformer在医学分割上的首次尝试
2021-11-01 20:28

zerone-fg的博客 Swin-Unet：Swin Transformer...更常见的做法还是直接嵌入到医学图像常用的网络结构中，比如Unet系列等，没有对transformer block做更多的创新，这主要是由于医学图像数据集太小导致对于transformer本身进行创新难以通
最新！CVPR 2021 视觉Transformer论文大盘点（43篇）
2021-06-01 01:10

Amusi（CVer）的博客点击下方卡片，关注“CVer”公众号AI/CV重磅干货，第一时间送达作者：Amusi | 来源：CVer前言从2020下半年开始，特别是2021上半年，Visual Transform...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 3月10日

悬赏问题

¥15 如何在scanpy上做差异基因和通路富集？
¥20 关于#硬件工程#的问题，请各位专家解答！
¥15 关于#matlab#的问题：期望的系统闭环传递函数为G(s)=wn^2/s^2+2¢wn+wn^2阻尼系数¢=0.707，使系统具有较小的超调量
¥15 FLUENT如何实现在堆积颗粒的上表面加载高斯热源
¥30 截图中的mathematics程序转换成matlab
¥15 动力学代码报错，维度不匹配
¥15 Power query添加列问题
¥50 Kubernetes&Fission&Eleasticsearch
¥15 報錯：Person is not mapped，如何解決？
¥15 c++头文件不能识别CDialog

对于transunet中在CNN后是如何传入transform的

问题遇到的现象和发生背景

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新