求一张在csdn上看到的描述自注意力机制中qkv的计算过程的gif动图

求一张曾在csdn上看到的描述自注意力机制中qkv的计算过程的gif动图，非常直观，现在找不到了，十分痛苦

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

4条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
阿里嘎多学长 2025-05-15 05:00
关注
阿里嘎多学长整理AIGC生成，因移动端显示问题导致当前答案未能完全显示，请使用PC端查看更加详细的解答过程

解答

你好！我理解你的问题，你想要找一张gif动图来描述自注意力机制中qkv的计算过程，这个过程是 transformer 模型中非常重要的一部分。

虽然我找不到你曾经在 CSDN 上看到的gif动图，但是我可以给你一个简单的计算过程：

qkv 计算过程可以分为三个步骤：

Query (Q)：将输入序列中的每个 token 的 embedding 通过一个线性变换层转换为 query向量。
Key (K)：将输入序列中的每个 token 的 embedding 通过一个线性变换层转换为 key向量。
Value (V)：将输入序列中的每个 token 的 embedding 通过一个线性变换层转换为 value向量。

然后，我们可以计算 attention 权重矩阵：

Attention(Q, K) = softmax(Q * K^T / sqrt(d))

其中，d 是 embedding 的维度。

最后，我们可以计算输出：

Output = Attention(Q, K) * V

这个过程可以用以下 Python 代码来实现：

import torch import torch.nn as nn import torch.nn.functional as F class SelfAttention(nn.Module): def __init__(self, d_model): super(SelfAttention, self).__init__() self.query_linear = nn.Linear(d_model, d_model) self.key_linear = nn.Linear(d_model, d_model) self.value_linear = nn.Linear(d_model, d_model) def forward(self, x): query = self.query_linear(x) key = self.key_linear(x) value = self.value_linear(x) attention = torch.matmul(query, key.T) / math.sqrt(d_model) attention = F.softmax(attention, dim=-1) output = torch.matmul(attention, value) return output

这个代码实现了自注意力机制中的 qkv 计算过程和 attention 权重计算过程。

希望这个解答能够帮助你！
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

图文理解自注意力(self-attention)
2020-07-20 22:18

数学编程的博客谷歌在2017年发表了一篇论文《Attention Is All You Need》，论文中提出了transformer模型，其核心就是self-attention的架构，这一突破性成果不仅洗遍了NLP的任务，也在CV中取得了非常好的效果，有大道至简的感觉。...
iOS GitHub上常用第三方框架
2017-04-19 15:39

Mr.时光流年的博客转载自：https://github.com/Tim9Liu9/TimLiu-iOS ...下拉刷新模糊效果AutoLayout富文本图表表...侧滑与右滑返回手势gif动画其他动画网络相关网络连接图像获取网络聊天网络测试网页框架WebView与WKWebView
最全面、最详细web前端面试题及答案总结
2021-02-01 09:34

赫兹/Herzz的博客总结不易，希望可以帮助到即将面试或还在学习中的web前端小伙伴，祝面试顺利，拿高薪！本章是HTML考点的⾮重难点，因此我们采⽤简略回答的⽅式进⾏撰写，所以不会有太多详细的解释。我们约定，每个问题后我们标记...
有哪些网站用爬虫爬取能得到很有价值的数据？
2019-05-05 17:47

BC_COM的博客 2.1 分析对象和分析方法 2.2 抱团的大V们：网络总体特征 2.3 给大V排个位：网络连接分析 2.4 不均衡中的均衡：Closeness和Betweenness中心度 2.5 大V都在关注什么：热门话题分析第三部分: 抓取各类项目数据汇总 0...
代码轮子
2019-03-06 14:36

allanGold的博客 PPRows for Mac- 在Mac上优雅的计算你写了多少行代码。open-source-ios-apps- iOS开源App集合，分：swift与Objective-C--国外人整理。NewsBlur作者独自一个人 Samuel Clay 做出来的一款名为 NewsBlur 的新闻阅读器, ...
2021-07-02 swift大礼包
2021-07-02 13:07

opooc的博客全面的Swift学习资料整理_walkerwqp的博客-CSDN博客全面的Swift学习资料整理 ...
Adroid 收集
2018-08-17 08:43

daimengs的博客用两张图告诉你，为什么你的 App 会卡顿? - Android - 掘金 Cover 有什么料？从这篇文章中你能获得这些料： ...相信有很多朋友都有过在 Activity 中通过 getWidth() 之类的方法获取 View 的宽高值，可能在 onCreat...
我不生产代码，只是代码的搬运工！超级多的 ——> 第三方
2018-10-24 17:48

梵尘yst的博客无意间看到一篇博客里面全是第三方，简直“丧心病狂”，能看到怀疑人生。总有一款适合你. ————————————————> 在掘金上又看到一篇（这篇做了整理有一些很少用到的蓝牙陀螺仪图表等）：...
区块链技术
2018-01-10 17:35

老何_低调的博客图2：在分布式计算中在异步系统和不可靠的通道上达到一致性是不可能的在这种情况下，因为是点对点的通信，双方不可能在这种情况下达到信息的一致性。严谨一点，就是“在分布式计算上，试图在异步系统和不可靠...
IOS 资料收集
2019-02-18 17:00

HiroGuo的博客在代码中纯手工创建约束灰常痛苦，但幸运的是我们有了SnapKit，在board中用上它，你可以简单直观地编写约束了。 PureLayout - PureLayout 是 iOS & OS X Auto Layout 的终极 API——非常简单，又非常强大。...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 5月15日

求一张在csdn上看到的描述自注意力机制中qkv的计算过程的gif动图

4条回答 默认 最新

解答

问题事件

4条回答默认最新