LRJ-jonas 2022-11-21 14:28 采纳率: 25%
浏览 0
已结题

多头注意力是怎么分割的?

问题

Multi-head attention进行分割时,是如何分割的?为什么这样做?

代码

Parameters:
x: Tensor
A tensor with shape [batch_size, seq_length, depth]
Returns:
A tensor with shape [batch_size, num_heads, seq_length, depth / num_heads]

我想要达到的结果

想要图解

  • 写回答

0条回答

      报告相同问题?

      相关推荐 更多相似问题

      问题事件

      • 系统已结题 11月29日
      • 创建了问题 11月21日

      悬赏问题

      • ¥15 粘贴替换字符串的时候,右边引号会自动换行导致报错
      • ¥15 用verilog HDL语法仿真
      • ¥15 用超表面产生涡旋光束,怎么用matlab代码算得到的涡旋光束的模式纯度
      • ¥40 返乡没拿电脑航班取消被困在机场了,C语言实验ddl要到了
      • ¥15 find 命令优化语句问题
      • ¥15 js 使用contenteditable属性模拟富文本框 实现具体关键字高亮
      • ¥15 QT QList<QLIst<int>> 遍历问题
      • ¥15 关于#C++#2048游戏问题
      • ¥15 这种html怎么制作
      • ¥60 高仿微信的即时通讯app