关于#人工智能#的问题：这个地方应该是query = y，value = x还是 query =wy ，key =wx， value = wx ，其中w为训练参数

multihead_attn = nn.MultiheadAttention(embed_dim, num_heads)
attn_output = multihead_attn(query, key, value)[0]

output: torch.Size([12, 64, 300])

batch_size 为 64，有 12 个词，每个词的向量是 300 维

我想知道这个query、key、value是经过线性变换前的还是已经变换后的。

比如原来的基础embding是x、y。

这个地方应该是query = y，key =x，value = x
还是 query =wy ，key =wx， value = wx ，其中w为训练参数。

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
CodeBytes 2023-02-18 13:17
关注
该回答引用ChatGPT

根据 nn.MultiheadAttention 的文档，query, key, value 输入的形状应该是 (seq_len, batch_size, embed_dim)，即每个时间步的输入向量形状是 (batch_size, embed_dim)。这里的 query, key, value 应该是经过线性变换后的向量。

在 nn.MultiheadAttention 的初始化中，有三个线性层，分别对应 query, key, value 的线性变换，可以使用 nn.Linear 模块来实现，其中 in_features 表示输入向量的维度，out_features 表示输出向量的维度。比如：

query_linear = nn.Linear(embed_dim, embed_dim) key_linear = nn.Linear(embed_dim, embed_dim) value_linear = nn.Linear(embed_dim, embed_dim) query = query_linear(y) key = key_linear(x) value = value_linear(x)

这样，query, key, value 就是经过线性变换后的向量。
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

关于#人工智能#的问题：这个地方应该是query = y，value = x还是 query =wy ，key =wx， value = wx ，其中w为训练参数人工智能深度学习
2023-02-18 12:48

回答 1 已采纳该回答引用ChatGPT 根据 nn.MultiheadAttention 的文档，query, key, value 输入的形状应该是 (seq_len, batch_size, embed_di
关于#java#的问题：jpa,sql语句不会写 java
2021-10-18 15:17

回答 1 已采纳 @Query(nativeQuery = true, value = "INSERT INTO vaccine_time(vs_id, vt_time, depart_id, remark,crea
关于#java#的问题：jpa语句怎么写, 急 java 有问必答
2021-10-17 18:43

回答 2 已采纳肯定是你写的不对呀，你的插入sql写错了，insert有两种写法，你搞混了，你不该使用values而是使用valueinsert into 表名(字段名，xxx) value (值,xxx)inser
神经网络基础：从生物神经元到人工神经元
2024-04-01 00:55

禅与计算机程序设计艺术的博客 人工智能领域中,神经网络作为一种重要的机器学习模型,已经广泛应用于计算机视觉、自然语言处理、语音识别等众多领域,取得了令人瞩目的成就。神经网络的核心思想源于人类大脑中神经元之间的信息传递与处理机制。通过...
将query_string作为key => value插入数组 php
2012-03-25 15:23

回答 1 已采纳 Are you try to access your GET or POST data (in your query). If so you just have to use the global
在PHP中为多个数组分配相同的key => value对 php
2014-12-10 20:52

回答 1 已采纳 You should pass $array to the foreach loop by reference too, like &$array. Checkout this Demo
如何以key：value格式编写JSON数组 json php
2019-07-18 07:58

回答 2 已采纳 Try this: $result = $conn->query("SELECT dbname FROM users ORDER BY dbname ASC"); $dblist = []
基于AutoHotkey的智能翻译器
2021-11-28 13:59

冷月风华的博客基于AutoHotkey的便捷翻译器SmartTranslator用AHK写的智能翻译器，支持查词和翻译1.API接口2.功能简述3.使用方法4.操作演示5.源代码6.软件及代码下载用AHK写的智能翻译器，支持查词和翻译 1.API接口词典接口：海...
Elasticsearch查询使用Go Olivere / elastic过滤value1 == value2的文档 elasticsearch
2019-09-04 11:49

回答 1 已采纳 query = query.Filter(elastic.NewScriptQuery(elastic.NewScript("doc['val1'].value == doc['val2'].va
jsp页面中的alert("<bean:message key="user.login.timeout"/>")语句报错，具体错误如下 javascript
2019-07-06 17:47

回答 1 已采纳 alert 的参数是字符串，字符串用双引号时，而内容中又有双引号，则需要转义，这种情况下建议用单引号： ``` alert('') ```
MySQL选择行值为Key => Value mysql php sql
2014-03-07 17:10

回答 1 已采纳 Not sure if this is what you want SELECT a.title, GROUP_CONCAT(b.todolist_id SEPARATOR ','
【AI+CAD】（一）ezdxf 解析DXF文件
2024-03-04 19:15

Yuezero_的博客【AI+CAD】（一）ezdxf 解析DXF文件
如何插入...值...其中Value =等于用户给出的值？复杂的查询 html mysql php
2019-03-26 17:34

回答 1 已采纳 Instead of insert You should use UPDATE update refer set partnerCode = '$partnerCode'
自然语言处理中的Attention机制总结
2018-08-22 15:20

哈哈进步的博客在面试的过程中被问到了attention，原来虽然其实已经实际用过attention了，也知道个大概原理是加权求和，但是对于加权的具体方法以及权值得分的计算并不是很清晰，面试答的一般，正好最近实习的地方
神经网络多种注意力机制原理和代码讲解
2023-11-02 21:06

一泛式的博客 std=0.001) if m.bias is not None: init.constant_(m.bias, 0) def forward(self, x): b, c, _, _ = x.size() y = self.avg_pool(x).view(b, c) y = self.fc(y).view(b, c, 1, 1) return x * y.expand_as(x) if __...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 2月26日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 2月18日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 2月18日

悬赏问题

¥17 pro*C预编译“闪回查询”报错SCN不能识别
¥15 微信会员卡接入微信支付商户号收款
¥15 如何获取烟草零售终端数据
¥15 数学建模招标中位数问题
¥15 phython路径名过长报错不知道什么问题
¥15 深度学习中模型转换该怎么实现
¥15 HLs设计手写数字识别程序编译通不过
¥15 Stata外部命令安装问题求帮助！
¥15 从键盘随机输入A-H中的一串字符串，用七段数码管方法进行绘制。提交代码及运行截图。
¥15 TYPCE母转母，插入认方向