Focus1988 2022-05-07 17:55 采纳率: 100%
浏览 4
已结题

用RL做NLP,和 根据那条数据的reward重新标注那条数据 有什么区别?

用RL做NLP,和 根据那条数据的reward重新标注那条数据 有什么区别?
(RL = reinforcement learning)

  • 写回答

0条回答 默认 最新

    报告相同问题?

    问题事件

    • 系统已结题 5月15日
    • 创建了问题 5月7日

    悬赏问题

    • ¥15 ansys fluent计算闪退
    • ¥15 有关wireshark抓包的问题
    • ¥15 Ubuntu20.04无法连接GitHub
    • ¥15 需要写计算过程,不要写代码,求解答,数据都在图上
    • ¥15 向数据表用newid方式插入GUID问题
    • ¥15 multisim电路设计
    • ¥20 用keil,写代码解决两个问题,用库函数
    • ¥50 ID中开关量采样信号通道、以及程序流程的设计
    • ¥15 U-Mamba/nnunetv2固定随机数种子
    • ¥30 C++行情软件的tick数据如何高效的合成K线