我才不是蠢蛋 2023-01-15 15:25 采纳率: 33.3%
浏览 94
已结题

强化学习收敛但效果不好

用强化学习DQN做动态障碍物避碰,训练5000轮,大概在3000轮收敛。但是熟练后仍然会发生碰撞,且避碰的路径十分弯曲。这种情况是神经网络搭的不好吗?

  • 写回答

4条回答 默认 最新

  • heart_6662 2023-01-15 15:27
    关注

    望采纳!!!点击回答右侧采纳即可!!
    这种情况可能是由于神经网络搭建的不好导致的。在强化学习中,DQN算法是通过记忆库来学习经验来更新网络参数,如果记忆库里面的样本不够充分或者质量不高,可能导致网络学习到了不够优秀的策略。

    另外,网络结构和超参数也可能对结果有影响。例如,如果网络结构不够深或者参数不够大,可能会导致网络学习能力不足。

    建议您尝试更改网络结构,增加训练轮数,或者使用其他强化学习算法来解决这个问题。

    评论 编辑记录

报告相同问题?

问题事件

  • 已结题 (查看结题原因) 1月16日
  • 创建了问题 1月15日