-Love-Coding- 2022-05-07 17:55 采纳率: 100%
浏览 4
已结题

用RL做NLP,和 根据那条数据的reward重新标注那条数据 有什么区别?

用RL做NLP,和 根据那条数据的reward重新标注那条数据 有什么区别?
(RL = reinforcement learning)

  • 写回答

0条回答 默认 最新

    报告相同问题?

    问题事件

    • 系统已结题 5月15日
    • 创建了问题 5月7日