用强化学习DQN做动态障碍物避碰,训练5000轮,大概在3000轮收敛。但是熟练后仍然会发生碰撞,且避碰的路径十分弯曲。这种情况是神经网络搭的不好吗?
4条回答 默认 最新
heart_6662 2023-01-15 15:27关注望采纳!!!点击回答右侧采纳即可!!
这种情况可能是由于神经网络搭建的不好导致的。在强化学习中,DQN算法是通过记忆库来学习经验来更新网络参数,如果记忆库里面的样本不够充分或者质量不高,可能导致网络学习到了不够优秀的策略。另外,网络结构和超参数也可能对结果有影响。例如,如果网络结构不够深或者参数不够大,可能会导致网络学习能力不足。
建议您尝试更改网络结构,增加训练轮数,或者使用其他强化学习算法来解决这个问题。
解决 无用评论 打赏 举报 编辑记录