文章MLP-Mixer 代码维度问题

model = MLPMixer(in_channels=3, dim=512, num_classes=1000, patch_size=16, image_size=224, depth=2, token_dim=256,channel_dim=2048)



  self.to_patch_embedding = nn.Sequential(
            nn.Conv2d(in_channels, dim, patch_size, patch_size),
            Rearrange('b c h w->b (h w) c')
        )

这里想问一下 dim ,token_dim,channel_dim 的数值是真么来的

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

JJJ69 2024-03-28 13:33

关注

在MLP-Mixer中，原始图像会被分割成多个不重叠的补丁，每个补丁会被展平为一个向量，然后输入到网络中。维度问题可能包括：

输入维度：
    输入图像的维度通常是 (H, W, C)，其中 H 是高度，W 是宽度，C 是通道数（对于RGB图像通常是3）。
    补丁大小决定了每个补丁向量的维度，例如，如果补丁大小为 (P, P, C)，那么每个补丁展平后的向量维度就是 P * P * C。

序列长度：
    MLP-Mixer将图像视为一系列补丁的序列，序列长度等于图像被分割后的补丁数量，例如，若图像大小为 (H, W)，补丁大小为 (P, P)，不考虑边界效应，则序列长度大约为 (H/P) * (W/P)。

隐藏层维度：
    MLP-Mixer中每个MLP模块的隐藏层维度是可以自定义的，通常标记为 hidden_size。在混合（Mixing）MLP中，输入补丁序列的每个元素会经过隐藏层的变换，隐藏层的维度不同于输入和输出维度。

输出维度：
    输出维度通常与输入维度相同，即补丁序列经过网络处理后，仍保持相同的维度，只是每个补丁的特征表示得到了更新。

在实际代码实现中，确保输入数据的预处理（如 patchify 和展平操作）正确，并且在网络架构定义时设置好各个MLP层的输入输出维度，是非常关键的，这样才能确保模型正确地处理和学习图像数据。

报告相同问题？

关注问题

mlp手写体数字识别参数解释 python
2021-12-21 16:26

回答 1 已采纳隐藏层数是神经网络的结构，训练次数是迭代训练了多少次。
GNN解决图着色（图论）问题 pycharm python tensorflow
2023-04-20 10:03

回答 6 已采纳关于loss变化的问题，可能是因为RNN循环的次数较多（32），导致模型训练较慢，需要更多的迭代才能收敛。此外，模型可能存在梯度爆炸或消失问题，可以尝试加入梯度裁剪或使用其他的优化器和学习率调整策略。
几种人工神经网络之间的异同问题神经网络
2023-04-21 21:21

回答 1 已采纳基于Monster 组和GPT的调写： MLP 网（多层感知器网络）是一种前向反馈神经网络，由多个全连接的神经元层组成。每一层的神经元接收上一层的输出作为输入，并将它们线性组合并通过一个激活函数产生输
第54步深度学习图像识别：MLP-Mixer建模（Pytorch）
2023-07-24 09:24

Jet4505的博客第54步深度学习图像识别：MLP-Mixer建模（Pytorch）
关于相似数据训练出来的神经网络问题 python 神经网络
2021-10-04 18:54

回答 1 已采纳相同随机种子和相同训练集训练出来的结果是一样的（不考虑显卡TPU等硬件造成的差异）一般来说相似数据集训练出的权重是相似的
二分类的f1 score一般多大算合格？人工智能深度学习神经网络
2022-03-30 22:17

回答 2 已采纳不妨参考一下F1 score的公式做一个简单的基准模型，假设正类在数据集中占比为a，对于数据集中的任一样本，均将其预测为正类，根据公式f1_score = a / (a - (1 - a) / 2)
关于新版tensorflow 'Sequential' object has no attribute 'predict_classes'的问题 python tensorflow 深度学习
2022-03-30 17:20

回答 2 已采纳我仔细思考了一下终于解决啦！我的数据为sigmoid函数映射到0和1之间分布的点数，我想把他以大于0.5和小于0.5分别预测为1和0，输出的结果为0 1分布，但是新版tensorflow没有predi
浅谈 Mlp-Mixer（pytorch and keras）
2021-07-11 19:19

__不想写代码__的博客例如：随着人工智能的不断发展，机器学习这门技术也越来越重要，很多人都开启了学习机器学习，本文就介绍了机器学习的基础内容。提示：以下是本篇文章正文内容，下面案例可供参考一、pandas是什么？示例：pandas...
通过Python multiprocessing库的Pool进程池实现多进程并等待所有进程执行完毕的问题 python
2022-11-11 11:37

回答 5 已采纳看例子，用队列来实现，监测每个子进程的执行完成状态，子进程执行完成后入队： import subprocess as sp import multiprocessing as mp import ti
如何解决Layer type `softmax` is not implemented python 人工智能机器学习深度学习神经网络
2019-09-07 23:46

回答 1 已采纳从你所问一系列问题，感觉你基本一窍不通，程序运行不了，应该先看 readme.md / readme.txt 文档，搞清楚环境然后下载作者提供的原始数据集，先跑通程序，然后再让你的数据集的格式、维
python深度学习分类后的混淆矩阵的意义 python 人工智能机器学习深度学习神经网络
2019-09-13 16:13

回答 1 已采纳这是因为你在倒数第五行有一句‘print(predict3\_train)’啊，所以输出了它的维度
深度学习之图像分类（二十一）-- MLP-Mixer网络详解
2021-09-28 12:48

木卯_THU的博客深度学习之图像分类（二十一）MLP-Mixer网络详解目录深度学习之图像分类（二十一）MLP-Mixer网络详解1. 前言2. MLP-Mixer 网络结构3. 总结4. 代码继 Transformer 之后，我们开启了一个新篇章，即无关卷积和注意力...
python深度学习分类后的混淆矩阵的显示方式为什么不是单纯的一个矩阵 python 人工智能机器学习深度学习神经网络
2019-09-11 00:07

回答 1 已采纳 https://blog.csdn.net/qq_36982160/article/details/80038380
Mlp-Mixer 阅读笔记
2022-04-14 23:45

山城火锅有点甜的博客本文会做对文章的解读，以及和卷积的一些对比论文链接： https://arxiv.org/pdf/2105.05537.pdf 代码：GitHub - google-research/vision_transformer 摘要 Mlp-mixer是谷歌最近提出的基于纯mlp结构的cv框架。它...
如何评价Google提出的MLP-Mixer：只需要MLP就可以在ImageNet上达到SOTA？
2021-05-10 16:23

初识-CV的博客 MLP-Mixer: An all-MLP Architecture for Vision是谷歌大脑的研究员（原ViT团队）在网络架构设计方面挖的新坑，它无需卷积、注意力机制，MLP-Mixer仅需MLP即可达到与CNN、Transformer相媲美的性能。比如，在JFT-300M...
没有解决我的问题, 去提问

悬赏问题

¥15 如何在scanpy上做差异基因和通路富集？
¥20 关于#硬件工程#的问题，请各位专家解答！
¥15 关于#matlab#的问题：期望的系统闭环传递函数为G(s)=wn^2/s^2+2¢wn+wn^2阻尼系数¢=0.707，使系统具有较小的超调量
¥15 FLUENT如何实现在堆积颗粒的上表面加载高斯热源
¥30 截图中的mathematics程序转换成matlab
¥15 动力学代码报错，维度不匹配
¥15 Power query添加列问题
¥50 Kubernetes&Fission&Eleasticsearch
¥15 報錯：Person is not mapped，如何解決？
¥15 c++头文件不能识别CDialog

码龄粉丝数原力等级 --

文章MLP-Mixer 代码维度问题

1条回答默认最新

码龄粉丝数原力等级 --

悬赏问题

文章MLP-Mixer 代码维度问题

1条回答 默认 最新

悬赏问题

1条回答默认最新