Miracle^Z 2023-02-16 15:51 采纳率: 50%
浏览 20

在T5模型里,怎么不使用teacher forcing换成auto regressive

请问在T5模型里,怎么不使用teacher forcing换成auto regressive?

  • 写回答

2条回答 默认 最新

  • 答主 2023-02-16 15:58
    关注

    在T5模型中,使用teacher forcing是为了训练模型,使其在每个时间步都可以观察到正确的前面的标记(ground-truth)并预测下一个标记。这在训练期间可能是有益的,但在实际的生成任务中,你可能希望模型能够在没有前面正确标记的情况下生成后续标记,这称为自回归(auto-regressive)模式。

    要在T5模型中使用自回归模式,可以使用“自回归循环”(autoregressive loop)来逐步生成输出。这个循环将输入编码成一个“上下文向量”(context vector),然后用它来预测下一个标记。每次循环中的输入都是前一个标记的嵌入向量(embedding vector)和上下文向量,输出是下一个标记的预测。

    评论

报告相同问题?

问题事件

  • 创建了问题 2月16日

悬赏问题

  • ¥15 (标签-51单片机|关键词-#include)
  • ¥15 裸板ESD问题的思考与实验
  • ¥15 electron+python
  • ¥50 远程调试PLC的解决方案的问题
  • ¥15 微信收付通中,自动分账的情况下,某一接收方分账失败了系统会自动在发起重新分账吗
  • ¥15 宝塔ssl证书一直待待验证
  • ¥15 相近语义 不同表达 匹配
  • ¥15 [vasp+phonopy]表面模型的间隙扩散系数中尝试频率如何用声子频率计算
  • ¥15 web前端开发怎么实现像图片这样的页面啊?
  • ¥15 ubuntu 20.04 网卡启用后,只有ipv6 没有 ipv4 无法上网