qq_50787320 2024-06-23 20:35 采纳率: 0%
浏览 354

强化学习奖励突然下降

我用的是MA2C算法,在强化学习运行2000步之后,奖励突然下降很多,后面就一直在一个较低的点附近了,很困惑,不知道要怎么改,求帮助

img

  • 写回答

2条回答 默认 最新

  • 奶昔owo 2025-05-10 00:50
    关注

    你好,想问问解决了吗

    评论

报告相同问题?

问题事件

  • 创建了问题 6月23日