_love_coding_ 2022-05-07 17:55 采纳率: 100%

浏览 4

已结题

用RL做NLP，和根据那条数据的reward重新标注那条数据有什么区别？

用RL做NLP，和根据那条数据的reward重新标注那条数据有什么区别？
（RL = reinforcement learning）

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

报告相同问题？

关注问题

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 5月15日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 5月7日