关于这篇论文的这个模块中说的是使用了注意力机制,查询与头实体h有关的邻居(r,e) 但是他给的计算公式看不懂,正常的注意力机制不都是要计算q,k,v的吗? 为什么这里没有计算q,k,v 反而是(r,e)乘一个线性变换矩阵W 再经过一个权重向量U,最后使用非线性变换LeakyReLU就可以获得绝对注意分数?
1条回答 默认 最新
悬赏问题
- ¥15 写uniapp时遇到的问题
- ¥15 matlab有限元法求解梁带有若干弹簧质量系统的固有频率
- ¥15 找一个网络防御专家,外包的
- ¥100 能不能让两张不同的图片md5值一样,(有尝)
- ¥15 informer代码训练自己的数据集,改参数怎么改
- ¥15 请看一下,学校实验要求,我需要具体代码
- ¥50 pc微信3.6.0.18不能登陆 有偿解决问题
- ¥20 MATLAB绘制两隐函数曲面的交线
- ¥15 求TYPCE母转母转接头24PIN线路板图
- ¥100 国外网络搭建,有偿交流