强化学习自动控制问题

目前遇到一个利用强化学习的自动控制问题，输入3个变量，输出10个变量，给定两组状态，也就是两组输出变量的值，两组之间阶跃变化，让算法找到拟合最佳的两组输入，这里action就是输入，输出与目标值的差距是reward。这样阶跃的两个状态算不算是两个环境了呢，属于多任务么？目前尝试了ddpg、sac、td3，只拟合一组输出效果还可以，拟合两组的阶跃变化效果不尽人意。

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

4条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
Bony- 2023-02-16 14:55
关注
根据描述，您提到的自动控制问题可以看作是一个多输出的回归问题，其中输入是三个变量，输出是十个变量，您希望找到一组最佳输入，使其输出与给定的两组状态的变化趋势一致。

这种问题可以看作是一个强化学习的问题，其中输入可以作为状态（state），输出可以作为动作（action），让算法学习到对应的状态-动作映射关系。但是由于输出是多个变量，因此需要使用多输出的强化学习算法，比如 Multi-Output Deep Deterministic Policy Gradient (MODDPG) 或 Multi-Headed Deep Deterministic Policy Gradient (MH-DDPG)
另外，如果您需要训练模型来拟合两组阶跃变化的输出，可以考虑使用多任务学习。多任务学习可以让模型同时学习多个任务，共享一些参数，从而提高模型的泛化能力。在这种情况下，您可以将每组阶跃变化看作是一个任务，让模型同时学习两个任务，从而提高模型的性能。

总之，根据您的描述，您的问题可以被视为一个多输出的强化学习或多任务学习问题，您可以尝试使用多输出的强化学习算法或者多任务学习算法来解决。同时，还需要对数据集进行充分的预处理和特征提取，以提高模型的拟合能力和泛化能力。

解决无用
评论打赏
分享
举报编辑记录

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

强化学习实现自动驾驶的仿真平台人工智能机器学习自动驾驶
2023-02-28 19:40

回答 1 已采纳对于深度强化学习来实现自动驾驶，可以使用Python语言的TensorFlow和Keras等深度学习框架，它们提供了丰富的API接口，便于开发者更方便地实现相应的功能。此外，还可以使用Unity3D游
关于强化学习转文本的问题人工智能深度学习
2023-01-10 16:43

回答 1 已采纳一种方法是使用规则-基本的方法，您可以将状态-动作序列中的每个状态和动作映射到特定的文本语句。这种方法虽然简单，但它只适用于非常简单的状态-动作序列，并且需要大量的人工编写规则。另一种方法是使用深度
matlab强化学习报错 matlab 人工智能深度学习
2022-12-28 21:52

回答 1 已采纳望采纳！！点击该回答右侧的“采纳”按钮即可采纳！我猜测在你这个版本的matlab中，representation对象将在未来的版本中删除，不能自动将representation对象转换为functio
强化学习的自动驾驶控制技术研究进展
2021-02-18 13:14

人工智能和机器学习领域的进步极大推动了自动驾驶技术的发展。当前主流的机器学习方法分为：监督学习、非监督学习和强化学习3种。强化学习方法更适用于复杂交通场景下自动驾驶系统决策和控制的智能处理，有利于提高...
关于#强化学习#的问题，如何解决？ python 人工智能
2023-03-18 21:53

回答 3 已采纳这个错误提示表明你在当前代码块中重复定义了名为 state 的变量。这可能会导致混淆和错误。解决这个问题的方法是找到第二次定义 state 的地方并将其删除或重命名。以下是一些可能会导致该错误的代码示
强化学习为什么要引入马尔可夫人工智能机器学习
2022-09-30 20:42

回答 1 已采纳大部分带有随机的算法证明收敛都是用马尔可夫来做的，比如pso的收敛验证，ga的收敛等一众进化演化算法
简单强化学习的跳棋系统软件 python 人工智能开发语言
2023-03-18 20:20

回答 2 已采纳参考GPT和自己的思路：这段代码是使用Python中的线程模块处理跳棋游戏的逻辑，在一个新的线程中启动了一个游戏对象（Game），并将该游戏对象的输入和输出队列传入其中。在该线程上运行的是一个游戏线
人工智能AI-图像处理cv-基于强化学习的自动化裁剪
2021-07-02 09:33

这个项目“人工智能AI-图像处理cv-基于强化学习的自动化裁剪”显然关注的是如何利用AI技术，特别是计算机视觉（cv）和强化学习，来实现图像的智能自动裁剪。计算机视觉是AI的一个分支，它致力于让机器理解并解释...
强化学习下车间调度的基础问题 python
2023-02-01 23:15

回答 1 已采纳在车间调度中，如果有30个待加工工件和20个机器，则"task=机器数x工件数"即 task=20x30=600。这个task代表有600种不同的工件与机器的配对组合，这些组合在强化学习框架下将被考虑
强化学习下的车间调度的基础问题 python
2023-02-02 10:48

回答 1 已采纳任务数量指的是工件的数量，也就是在车间内需要调度的工件的数量。因此，关于这个问题，具体是指工件的数量还是工序的数量需要根据具体模型的定义来判断。
强化学习是不是无人驾驶的未来？人工智能计算机视觉
2022-02-01 22:36

回答 3 已采纳感觉是
基于深度强化学习的原神自动钓鱼AI.完整代码数据可直接运行
2023-06-05 21:40

《基于深度强化学习的原神自动钓鱼AI》项目是一次将人工智能技术应用于游戏场景的创新实践，主要涉及了人工智能中的强化学习以及软件开发中的自动化工具设计。该项目利用深度强化学习算法，让AI模拟玩家在游戏《原神...
关于强化学习环境 Deepmind_lab问题，好人一生平安 tensorflow 人工智能机器学习深度学习神经网络
2020-05-28 21:58

回答 2 已采纳 https://blog.csdn.net/bornfree5511/article/details/106753399
基于深度强化学习的原神自动钓鱼AI.zip
2024-05-11 13:48

强化学习问题在信息论、博弈论、自动控制等领域有得到讨论，被用于解释有限理性条件下的平衡态、设计推荐系统和机器人交互系统。一些复杂的强化学习算法在一定程度上具备解决复杂问题的通用智能，可以在围棋和电子...
强化学习实现自动驾驶内含代码和预训练模型
2023-02-26 17:33

强化学习是一种人工智能领域的机器学习方法，它通过与环境的交互，让智能体通过试错学习最优策略，以达到最大化期望的奖励。在自动驾驶领域，强化学习的应用尤其引人注目，因为它能处理复杂的动态环境，并且不需要...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已结题（查看结题原因） 5月31日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 2月16日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 2月16日

悬赏问题

¥15 高通uboot 打印ubi init err 22
¥20 PDF元数据中的XMP媒体管理属性
¥15 R语言中lasso回归报错
¥15 网站突然不能访问了，上午还好好的
¥15 有没有dl可以帮弄”我去图书馆”秒选道具和积分
¥15 semrush,SEO,内嵌网站，api
¥15 Stata:为什么reghdfe后的因变量没有被发现识别啊
¥15 振荡电路，ADS仿真
¥15 关于#c语言#的问题，请各位专家解答！
¥15 这个如何解决详细步骤

强化学习自动控制问题

4条回答 默认 最新

问题事件

悬赏问题

4条回答默认最新