我才不是蠢蛋 2022-06-24 20:19 采纳率: 33.3%
浏览 21
已结题

DQN遇到大状态空间效果差

强化学习DQN应用在状态较多的环境下效果不好,如何改善

本人刚刚接触强化学习,在使用DQN进行路径规划时,当栅格环境较小时运行的效果不错,但当栅格数量成倍增长时效果较差。怀疑是奖励函数or神经网络方面的原因,但环境只是增大并没有别的变化,按道理讲奖励函数在小栅格环境中适用,在大环境中也应该可以,目前怀疑是神经网络过于简单,目前神经网络隐藏层三层,神经元每层128个,有必要再增加网络层数吗?
烦请支支招啦!!

  • 写回答

0条回答 默认 最新

    报告相同问题?

    问题事件

    • 系统已结题 7月2日
    • 创建了问题 6月24日

    悬赏问题

    • ¥15 深度学习根据CNN网络模型,搭建BP模型并训练MNIST数据集
    • ¥15 lammps拉伸应力应变曲线分析
    • ¥15 C++ 头文件/宏冲突问题解决
    • ¥15 用comsol模拟大气湍流通过底部加热(温度不同)的腔体
    • ¥50 安卓adb backup备份子用户应用数据失败
    • ¥20 有人能用聚类分析帮我分析一下文本内容嘛
    • ¥15 请问Lammps做复合材料拉伸模拟,应力应变曲线问题
    • ¥30 python代码,帮调试,帮帮忙吧
    • ¥15 #MATLAB仿真#车辆换道路径规划
    • ¥15 java 操作 elasticsearch 8.1 实现 索引的重建