强化学习收敛但效果不好

用强化学习DQN做动态障碍物避碰，训练5000轮，大概在3000轮收敛。但是熟练后仍然会发生碰撞，且避碰的路径十分弯曲。这种情况是神经网络搭的不好吗？

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

4条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
heart_6662 2023-01-15 15:27
关注
望采纳！！！点击回答右侧采纳即可！！
这种情况可能是由于神经网络搭建的不好导致的。在强化学习中，DQN算法是通过记忆库来学习经验来更新网络参数，如果记忆库里面的样本不够充分或者质量不高，可能导致网络学习到了不够优秀的策略。

另外，网络结构和超参数也可能对结果有影响。例如，如果网络结构不够深或者参数不够大，可能会导致网络学习能力不足。

建议您尝试更改网络结构，增加训练轮数，或者使用其他强化学习算法来解决这个问题。

解决无用
评论打赏
分享
举报编辑记录

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

python编程实现的单智能体DQN强化学习算法
2025-07-19 17:46

Python作为一个高级编程语言，因其简洁易读的语法和丰富的科学计算库而成为实现AI算法的首选语言之一。实现DQN算法通常包括以下步骤： 1. 初始化回放缓冲区和神经网络参数。 2. 在环境中进行探索，收集经验和状态...
最优控制大作业（强化学习）
2023-07-12 12:11

【最优控制大作业（强化学习）】主要涉及的是在强化学习和最优控制的框架下解决实际问题，特别是针对异构四旋翼无人机姿态同步的人机系统。这个大作业旨在让学生深入理解和应用这两种方法，通过设计控制器来实现特定...
深度强化学习求解作业车间调度问题的python实现
2022-03-23 10:33

Actor-Critic算法是一种结合了策略梯度和值函数估计的强化学习方法，它在Actor部分负责更新策略网络，以生成动作，而在Critic部分则负责评估当前策略的效果，提供策略改进的指导。这种算法的优势在于它可以同时优化...
强化学习实验绘图[项目代码]
2025-11-14 10:00

在进行强化学习实验时，通常会生成大量数据，包括但不限于奖励信号、状态值、策略评估以及模型参数等。这些数据的有效可视化对于理解算法的运行机制、评估性能以及调试实验都至关重要。文章中首先介绍了使用...
javacatgame_java_强化学习_
2021-10-04 03:57

在本项目中，"javacatgame_java_强化学习_"是一个使用Java编程语言实现的强化学习算法应用，具体是设计了一个猫和老鼠的游戏环境。强化学习是机器学习的一个分支，它通过与环境的交互来学习最优策略，以最大化长期...
基于深度强化学习自动炒股python实现
2022-12-12 11:00

在这个项目中，Python编程语言被用作实现工具，它以其强大的数据处理能力和丰富的库支持，成为了进行此类任务的理想选择。首先，我们要理解深度强化学习的基本原理。深度强化学习是强化学习的一个分支，它利用深度...
强化学习算法-基于python的Q学习算法q-learning实现
2022-06-02 22:56

首先，Python作为一门高级编程语言，拥有丰富的科学计算库和数据处理工具，如NumPy、Pandas和Matplotlib等，使得在Python中实现Q学习变得十分便捷。NumPy库可以用于创建和操作多维数组，这对于存储和更新Q表至关重要...
关键词：微网优化调度深度强化学习 A3C 需求响应 编程语言：python平台主题：基于改进A3C算法的微网优化调度与需求响应管理内容简介：本文研究了各种深度强化学习算法对微电网
2025-01-11 11:18

本文研究了各种深度强化学习算法对微电网能量管理系统的增强效果。我们提出了一个新的微电网模型，它包括一个风力发电机、一个储能系统、一组恒温控制负载、一组价格响应负载以及一个与主电网的连接。拟议的能源...
基于Q-learning的改进版强化学习算法
2021-11-19 10:45

强化学习是一种重要的机器学习方法，它通过与...总之，本项目提供了一个基于Q-learning的强化学习算法改进实例，旨在提高收敛速度并有效解决路径规划问题。通过MATLAB实现，它为学习者和研究者提供了宝贵的实战经验。
基于改进A3C算法的微网优化调度与需求响应管理的深度强化学习实践研究 ,关键词：微网优化调度深度强化学习 A3C 需求响应 编程语言：python平台主题：基于改进A3C算法的微网优
2025-01-23 01:14

本文研究了各种深度强化学习算法对微电网能量管理系统的增强效果。我们提出了一个新的微电网模型，它包括一个风力发电机、一个储能系统、一组恒温控制负载、一组价格响应负载以及一个与主电网的连接。拟议的能源...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已结题（查看结题原因） 1月16日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 1月15日

强化学习收敛但效果不好

4条回答 默认 最新

问题事件

4条回答默认最新