1条回答 默认 最新
- ShowMeAI 2022-12-03 20:26关注
在deep learning model处理位置信息时有如下2种想法:
- ① 想办法将位置信息融入到输入中,这构成了绝对位置编码的一般做法;
- ② 想办法微调一下 Attention 结构,使得它有能力分辨不同位置的 Token,这构成了相对位置编码的一般做法。
可以参考如下资料中的形象解释:
本回答被题主选为最佳回答 , 对您是否有帮助呢?解决 无用评论 打赏 举报
在deep learning model处理位置信息时有如下2种想法:
可以参考如下资料中的形象解释: