1111111111111111

专家好，目前在研究强化学习的问题。我还是小白，我的问题是：

我有一个工作台，有四个站台，用传送带连接，用PLC 来控制。站台一可以选择导入黑，白，绿三种颜色的盒子，可只导入一个，也可以都导入。站台二可以为传送过来的小盒子放入黑色颗粒，站台三可以为传送来的小盒子放入白色颗粒，站台四可以为传送来的小盒子放入绿色颗粒。我给的PLC指令是，导入黑色盒子，然后在站台二向黑色盒子放入黑色颗粒，站台三向黑色盒子放入白色颗粒，站台四不放颗粒。我想实现的功能如下。

1. 如果我的指令有变化，比如说导入白色盒子，同时向白色盒子导入黑色和白色颗粒，如何实现? 当然我可以直接更改PLC 的指令，但是我想实现的功能是系统读取一个文档，然后让系统自动决策如何用PLC更改指令。

2. 还有就是如果系统收到的命令是导入红色盒子，红色盒子在系统中不存在，如何让系统自动报错？

我的想法是用强化学习，Agent就是小盒子，环境就是我设置的各种指令，比如文档是A，那么系统的行为就是B，文档是C，系统的行为就是D。请各位专家帮我看看，想法是否正确？我想先从最简单的强化学习模型入手，专家有没有相应的强化学习模型推荐呢？还有就是做强化学习，我是否需要搭建一个模拟环境呢？

视情况而定，可追加奖励。提前谢谢各位专家了。

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
树莓大王 2023-03-14 18:55
关注
感谢您的提问，我来为您解答。

针对您的第一个问题，如果您想要实现系统自动根据读取的文档来更改PLC指令，可以采用强化学习的方法。您的想法是正确的，Agent可以是小盒子，环境可以是指令设置，文档A可以对应着行为B，文档C可以对应着行为D。您可以设计一个强化学习模型，通过不断地尝试不同的行为（即不同的PLC指令），并根据系统的反馈（即小盒子放入颗粒的情况）来进行学习和优化。常见的强化学习模型包括Q-learning、Deep Q Network（DQN）等。不同的模型适用于不同的场景，您可以根据实际情况选择适合您的模型。

针对您的第二个问题，如果系统收到的命令是导入不存在的红色盒子，可以通过在系统中设置一个判断机制来实现自动报错。例如，您可以在程序中添加一个判断红色盒子是否存在的函数，如果不存在则触发错误提示。

至于您是否需要搭建一个模拟环境，这也视情况而定。如果您只是想验证强化学习模型的有效性，可以使用模拟环境模拟实际情况来进行测试。如果您要进行实际应用，就需要在现实环境中进行测试和优化。具体的实现细节还需要根据具体情况进行设计。

希望我的回答能够帮助到您，如果您还有其他问题，欢迎继续咨询。

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

1111111111111111
2023-07-02 15:00

叶子变黄的博客发答案发高烧。
代码qc111111111111111
2025-03-14 17:44

2. 前端QC指引文件：前端QC指引.emmx文件可能针对前端开发人员，说明在编写和审查前端代码时需要遵循的规范和建议，确保前端代码的稳定性和性能。 3. 代码QC指引更新文件：代码QC指引更新.emmx文件可能记录了最新的...
筱筱学前端Day7
2022-03-04 19:17

慕筱筱的博客本博客包含了对溢出属性和元素显示类型的详细介绍，属于前端较基础内容。
前端使用国密SM4进行加密、解密
2023-04-19 17:56

Fighting_p的博客前端使用国密SM4进行加密/解密的三种办法，报错 Uncaught RangeError: Invalid array length
前端AST详解，手写babel插件
2022-11-16 21:47

不叫猫先生的博客抽象语法树（Abstract Syntax Tree，AST），是源代码（不仅限于JavaScript，同时还应用于其他语言...对于前端来说很多⼯具，例如 elint 、 pretiier 对代码错误或⻛格的检查，babel、typescript对代码的编译处理等等。
java AES前端加密，Java后端解密
2021-07-08 17:07

爪哇life的博客 // key：必须16个字符，且要和前端保持一致 private final static String IV = "1111111111111111"; // 偏移量：必须16个字符，且要和前端保持一致 public static void main(String[] args) { JSONObject map = new...
【前端学习笔记】元素的显示类型
2022-01-04 22:13

爷傲奈我何_m的博客元素显示类型的分类依据CSS的显示块元素块状元素在页面中就是以块的形式显示，所谓... } style> head> <body> <img src="../img/big.png" alt=""> <p>1111111111111111p> body> html> 隐藏功能代码示例： DOCTYPE ...
来一个无封面的图 testt
2023-03-21 14:42

GIl a had 006的博客 1111111111111111tt
刑啊-mitmproxy核心代码
2024-08-10 15:25

超级小龙虾的博客 # 拦截请求并检查 URL 是否包含特定路径 print("444444444") if "http://example.com/path" in flow.request.pretty_url: print("1111111111111111") # 修改请求，例如添加自定义头 flow.request....
字符编码轻松学：从 ASCII 到 Unicode，再到 UTF 家族 —— 搞懂它们的 “前世今生”
2026-01-03 08:24

闪闪放光芒的博客 111000001010000010000000 65535的二进制为1111111111111111 够有效位不需要左侧补0 再填充到utf8三个字节里面为 111011111011111110111111 4、UTF-8四字节存储Unicode字符 Unicode 符号范围（十六进制） UTF-8 ...
没有解决我的问题, 去提问

1111111111111111

1条回答 默认 最新

1条回答默认最新