博主,请翻一下我的牌子,我想问一下,bart模型做摘要生成,训练时,encoder的输入和decoder的输入为啥不pad到一样的长度,bart不是transformer架构吗,如果不一样长度,encoder的输出给到decoder,会出现shape不匹配啊,如果不用pad到一样的长度,我想问一下如何解决shape不匹配的问题,将encoder的输出应用到decoder某一部分的输入呢
1条回答 默认 最新
悬赏问题
- ¥15 QT任务管理器无法正确获取展开,有悬赏15元速求,如何解决?(相关搜索:标识符|结构体)
- ¥15 使用delphi 10.3+intraweb 生成的页面怎么实现自动滚屏
- ¥20 思科:Router c3600 MN-4E插槽
- ¥15 16进制修改视频的元数据
- ¥15 HTML中css的位置信息居然会导致元素大小发生变化
- ¥15 岛津txt格式文件转nirs格式
- ¥15 石墨烯磁表面等离子体
- ¥15 angular 项目无法启动
- ¥15 安装wampserver,图标绿色,但是无法进入软件
- ¥15 C++ MFC 标准库 加密解密解惑