使用GAIL(Generative Adversarial Imitation Learning)实现逆向强化学习,按照其思路使用PyTorch编写一个模仿学习的程序去模仿一组对gym里面的Pendulum的专家动作。最后的程序里面的关键位置要有注释与论文中的公式、算法步骤相对应。
1条回答 默认 最新
相关推荐 更多相似问题
点击登录
提问题
悬赏问题
- ¥15 在matlab中如何进行三个参数的离散傅里叶逆变换(idft)
- ¥15 遇到问题了,求解答!
- ¥15 请问coppliasim eduUR5视觉抓取怎么实现仿真,
- ¥30 JavaWeb实验(购物平台)
- ¥15 八路抢答器倒计时设计时显示器不输出,只能显示0
- ¥15 用C语言随机生成一个迷宫
- ¥15 超多因素的正交方案设计
- ¥15 Scratch~汽车小游戏
- ¥30 OSGB转换为3dtiles
- ¥25 用于Audio的芯片中“Audio Interface”和“Mode Control”是什么?