自注意力空间注意力机制问题

最近写论文用到注意力机制，在看到的论文里基本上注意力机制是例如input-lstm-Attention-outup这么个结构，我想知道如果是对维度上的注意力机制分配，这个结构仿佛是对lstm层节点的一个注意力权重分配，而不是输入的多个变量的权重分配，不是很能理解。
另一个问题是，如果是多维多时间步的数据预测问题，那么注意力权重分配是对时间步的分配，还是维度应用注意力权重的。
实在困扰很久了，感谢各位的回复。
另外是我也看了空间注意力，通道注意力，自注意力，大多是各位博主的文章，还是不是很明白其中的差别，有看到文章使用空间注意力完成对特征重要性的分配，但是不能理解，也有看到使用自注意力机制进行维度分配的，我不能理解其中的差别。
另外有可以推荐相关的paper吗

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

4条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
追cium 2023-03-19 22:21
关注
参考GPT和自己的思路：

针对你的第一个问题，输入-Attention-LSTM-output结构通常是用于序列数据的注意力机制，其中输入是时序输入，LSTM是序列建模的模型，Attention会对序列中的每个时间步进行注意力权重分配，最终输出是LSTM的输出，其中权重分配是针对时序上的节点进行的，而不是输入的多个变量的权重分配。如果你想对维度上的注意力机制进行分配，可以考虑使用Transformer模型，其中自注意力机制可以对输入的每个维度进行注意力分配。

关于多维多时间步的数据预测问题，注意力机制的权重分配可以是对时间步的分配，也可以是对维度的分配，具体取决于你想要解决的问题和模型的架构，需要根据具体情况进行选择。

关于空间注意力、通道注意力和自注意力等的差别，简单来说，它们都是用于注意力机制的不同形式，空间注意力主要用于计算机视觉中的像素级别的注意力权重分配，通道注意力主要用于卷积神经网络中的通道维度的注意力权重分配，而自注意力主要用于对序列数据中的维度进行注意力权重分配。这些形式的注意力机制本质上是类似的，只是应用场景和具体实现有所不同。

如果你想深入了解注意力机制和相关应用领域的研究，可以参考以下论文：

Attention Is All You Need (Vaswani等人，2017年)
Non-local Neural Networks (Wang等人，2018年)
Self-Attention Networks (Parikh等人，2016年)
CBAM: Convolutional Block Attention Module (Woo等人，2018年)
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

attention注意力机制人工智能神经网络自然语言处理
2022-12-07 17:24

回答 1 已采纳望采纳如果你使用的是一个一维的tensor，那么在计算注意力时，注意力机制会对每个位置进行计算。如果你使用的是二维的tensor，那么注意力机制会对每行的数据进行计算。
LSTM神经网络添加注意力机制 python 数据挖掘
2022-10-22 23:55

回答 1 已采纳不知道你具体代码，只能说你的affine_layer()这个函数有三个返回值的，但是你只用2个参数你接收，所以报错了。换成三个参数看看，类似A,B,C=affine_layer()如果你确定你只要两个
注意力机制的输出，点积注意力机制 opencv 人工智能神经网络
2023-03-17 17:55

回答 4 已采纳参考GPT和自己的思路：根据您的描述，我可以理解您的问题为：在使用缩放点积注意力机制时，如果有 i 个向量进行运算，最终输出的张量是什么，它的形状是什么，以及如何解释其中的一个向量（如 h1 向量）
注意力机制详解系列（三）：空间注意力机制
2023-02-28 09:06

GoAI的博客本篇为注意力机制系列第三篇，主要介绍注意力机制中的空间注意力机制，着重详解DCN、Non-local、ViT、DETR等模型，下一篇将对混合注意力机制和时域注意力机制进行讲解。
请问AttentionMechanism注意力机制例子中的图是怎么生成的呢？ nlp tensorflow 深度学习
2018-04-16 11:56

回答 1 已采纳 https://blog.csdn.net/m0_38133212/article/details/86664569
请问CBAM注意力机制可以用于序列分类中吗 python
2023-03-08 15:32

回答 1 已采纳是的，CBAM注意力机制可以用于一维序列分类任务。CBAM注意力机制是一种通用的注意力机制，可以用于任何类型的数据。它通过学习每个通道的重要性，帮助模型更好地理解输入数据，从而提高模型的性能。在一维序
YOLOV5添加注意力机制SE后，训练时网络结构没有显示SE python 深度学习目标检测
2022-12-22 21:02

回答 2 已采纳在 YOLOv5 中添加注意力机制 SE 后，如果在训练时 SE 层没有显示，可能是因为在训练时 SE 层并没有真正被调用。在训练时，SE 层会被调用的条件是：在代码中应该有一个对应的函数调用，这
注意力模型Python程序
2019-03-14 17:36

8. **spatial_transformer**: 这可能指的是空间变换网络（Spatial Transformer Network），它是计算机视觉中的一种注意力机制，可以对输入图像进行几何变换，如平移、缩放和旋转，以改善模型对位置不变性的处理能力...
Go语言通道以及有关NewTicker的机制问题 golang
2022-10-12 14:51

回答 1 已采纳这种多线程操作谁先谁后不好说。有两个子线程和主线程同时运行。你没有用什么机制保证顺序执行
关于#Java多态执行机制#的问题 java 开发语言
2023-04-07 22:17

回答 2 已采纳主函数 new 了 RoundGlyph ，开始实例化RoundGlyph ，先进入RoundGlyph的构造方法，里面默认先调父类的构造方法初始化，然后开始打印如下： Glyph() befor
在多变量时序预测任务中，如何利用多头注意力机制计算各变量之间的相关系 python tensorflow 时序数据库
2023-04-04 20:05

回答 5 已采纳引用new bing作答：在多变量时序预测任务中，利用多头注意力机制求得各变量之间的相关系数，需要对输入的数据进行一些处理和调整。假设输入数据的维度为(batch_size, seq_len, num
注意力机制详解系列（二）：通道注意力机制
2023-02-26 09:30

GoAI的博客本篇主要介绍注意力机制中的通道注意力机制，对通道注意力机制方法进行详细讲解，通道注意力机制在计算机视觉中，更关注特征图中channel之间的关系，重点对SENet、ECANe进行重点讲解。
用GAT图注意力网络做链路预测工作，怎么提高预测准确率？人工智能深度学习神经网络
2023-02-10 01:31

回答 2 已采纳以下答案引用自GPT-3大模型,请合理使用：如果你想要学习率衰减的方法，可以参考这份文章：https://www.quora.com/How-can-I-improve-the-learning-ra
卷积神经网络中的注意力机制(Attention Mechanism)
2023-07-12 01:25

AI天才研究院的博客卷积神经网络中的，并根据所计算的统计量对该维度上的每一个元素赋予不同的权重，用以增强网络的特征表达能力。卷积层的特征维度包括通道维度C和空间维度HW。
注意力机制与LSTM的结合
2024-04-26 13:17

AI天才研究院的博客 注意力机制（Attention Mechanism）是一种允许模型在生成每个元素时都聚焦于输入序列中与当前输出最相关的部分的技术。通过引入注意力机制，模型能够更好地处理长序列，提高了模型的表现力和泛化能力。将注意力机制...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 3月19日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 3月19日

悬赏问题

¥15 如何让子窗口鼠标滚动独立，不要传递消息给主窗口
¥15 如何能达到用ping0.cc检测成这样？如图
¥15 关于#DMA固件#的问题，请各位专家解答！
¥15 matlab生成的x1图不趋于稳定，之后的图像是稳定的水平线
¥15 请问华为OD岗位的内部职业发展通道都有哪些，以及各个级别晋升的要求
¥20 微信小程序 canvas 问题
¥15 系统 24h2 专业工作站版，浏览文件夹的图库，视频，图片之类的怎样删除？
¥15 怎么把512还原为520格式
¥15 MATLAB的动态模态分解出现错误，以CFX非定常模拟结果为快照
¥15 求高通平台Softsim调试经验

自注意力空间注意力机制问题

4条回答 默认 最新

问题事件

悬赏问题

4条回答默认最新