模块嵌套引起的神经网络维度错误

神经网络维度错误

尝试将注意力机制和卷积模块融合在一起，出现了一个比较奇怪的事，关键代码如下：

class Feature_Extractor_Enc(nn.Module):
    def __init__(self, emb_size, num_channel):
        super().__init__()
        self.num_channel = num_channel
        self.emb_size = emb_size

        self.temporal_spatial =  nn.Conv2d
        self.spatial_temporal = nn.Conv2d
        self.projection = XXX

        self.attention = TransformerBlock(emb_size=40)

    def forward(self, X):
        x,y = X[0],X[1]
        x = self.temporal_spatial(x) + self.spatial_temporal(x)
        x = self.projection(x)
        x = self.attention(x)

        y = self.temporal_spatial(y) + self.spatial_temporal(y)
        y = self.projection(y)
        y = self.attention(y)
        return (x,y)
class TransformerBlock(nn.Sequential):
    def __init__(self,
                 emb_size,
                 num_heads=10,
                 drop_p=0.5,):
        super().__init__(MultiHeadAttention(emb_size,num_heads,drop_p))
      
class MultiHeadAttention(nn.Module):
    def __init__(self, emb_size, num_heads, dropout):
        super().__init__()
        self.emb_size = emb_size
        self.num_heads = num_heads

        self.keys = nn.Linear(emb_size,emb_size)
        self.queries = nn.Linear(emb_size,emb_size)
        self.values = nn.Linear(emb_size,emb_size)

        self.att_drop = nn.Dropout(dropout)
        self.projection = nn.Linear(emb_size,emb_size)

    def forward(self,x:Tensor, mask: Tensor=None) -> Tensor:
        queries = rearrange(self.queries(x), 'b n (h d) -> b h n d', h = self.num_heads)
        keys = rearrange(self.keys(x), "b n (h d) -> b h n d",h = self.num_heads)
        values = rearrange(self.values(x), "b n (h d) -> b h n d", h = self.num_heads)
        energy = torch.einsum("bhqd, bhkd -> bhqk",queries,keys)

        scaling = self.emb_size **(1/2)
        att = F.softmax(energy/scaling,dim=-1)
        att = self.att_drop(att)
        out = torch.einsum("bhal, bhlv -> bhav",att,values)
        out = rearrange(out, "b h n d -> b n (h d)")
        out = self.projection(out)
        return out

报错是说，MultiHeadAttention的输入是（n,e）维的，期待是（b,n,e）维的。我输出了 x = self.attention(x)的输入，是（b,n,e）维的。这是怎么回事呢

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
Allen_Smath 2024-11-28 16:29
关注
破案了，是我下面定义了一个一模一样的TransformerBlock，重名了，送给下一个去了

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

神经网络 各个模块介绍（Pytorch 07）
2024-03-30 21:12

处女座_三月的博客例如，我们上面模型中的第一个全连接的层接收一个20维的输入，但是返回一个维度为256的输出。计算其输出关于输入的梯度，可通过其反向传播函数进行访问。通常这是自动发生的。存储和访问前向传播计算所需的参数。...
神经网络和人工智能原理,人工神经网络基本原理
2022-08-31 19:16

神经网络技术宅的博客一些基本常识和原理[什么叫神经网络?]人的思维有逻辑性和直观性两种不同的基本方式写作猫。逻辑性的思维是指根据逻辑规则进行推理的过程；它先将信息化成概念，并用符号表示，然后，根据符号运算按串行模式进行逻辑...
【AI】深度学习——人工智能、深度学习与神经网络
2023-10-09 16:32

AmosTian的博客深度学习天然是神经网络，介绍了人类大脑机制，与神经元的工作机制，人工神经网络有三种模型（前馈，记忆，图网络），且本身是解决贡献度分配问题介绍了神经网络发展史，以及常用的非线性激活函数，S型（logistic,...
人工智能和卷积神经网络,卷积神经网络算法实现
2022-10-17 14:14

快乐的小蓝猫的博客目前AI常见的应用领域：图像识别（安防识别、指纹、美颜、图片搜索、医疗图像诊断），用的是“卷积神经网络（CNN）”，主要提取空间维度的特征，来识别图像。换句话说，现在复兴的人工智能更多仅限于最底层的，比如...
【综述】一文读懂卷积神经网络(CNN)
2022-09-07 00:52

本初-ben的博客卷积神经网络是多层感知机(MLP)的变种，由生物学家休博尔和维瑟尔在早期关于猫视觉皮层的研究发展而来，视觉皮层的细胞存在一个复杂的构造，这些细胞对视觉输入空间的子区域非常敏感，称之为感受野。CNN由纽约大学的...
【人工智能】神经网络实现鸢尾花分类
2022-08-19 20:17

萌狼蓝天的博客 神经网络实现鸢尾花分类环境：tensorflow2.3.0 python3.7.13 numpy1.21.5 (一)准备数据 1.数据集录入 from sklearn import datasets # 没有的需要先安装：pip install sklearn x_data = datasets.load_iris()....
跟李沐学AI：PyTorch神经网络基础
2024-07-22 23:04

Landy_Jay的博客例如，我们上面模型中的第一个全连接的层接收一个20维的输入，但是返回一个维度为256的输出。计算其输出关于输入的梯度，可通过其反向传播函数进行访问。通常这是自动发生的。存储和访问前向传播计算所需的参数。...
一文读懂循环神经网络—门控循环单元
2025-07-15 18:05

墨尘游子的博客深度学习工具库 import math # 数学运算 import torch # PyTorch框架 from torch import nn # 神经网络模块 from torch.nn import functional as F # 函数式API # 图像显示相关库（解决中文和符号显示问题） import ...
神经网络层结构全解析：从基础构建到深度学习模型
2025-11-06 10:31

Dfreedom.的博客 神经网络本质上是复杂的数学函数，能够将输入数据映射到期望输出。其核心结构包括输入层（接收原始数据...神经网络的价值在于自动从数据中学习映射规则，无需人工定义复杂规则，使其在图像、语音等复杂任务中表现出色。
深度学习 Pytorch 单层神经网络
2025-01-25 23:11

noruta的博客在人脑神经细胞中，轴突控制电子信号流过的强度，在人工神经网络中，神经元之间的连接线上的权重也代表了信息可通过的强度。最简单的例子是，当 w w w为0.5时，在特征 x 1 x_1 x1上的信息就只有0.5倍能够传递到下...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 12月6日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 11月28日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 11月28日

模块嵌套引起的神经网络维度错误

神经网络维度错误

1条回答 默认 最新

问题事件

1条回答默认最新