na_tion 2021-05-21 21:45 采纳率: 50%
浏览 24

1111111111111111

专家好,目前在研究强化学习的问题。 我还是小白,我的问题是:

我有一个工作台,有四个站台,用传送带连接,用PLC 来控制。站台一可以选择导入黑,白,绿三种颜色的盒子,可只导入一个,也可以都导入。站台二可以为传送过来的小盒子放入黑色颗粒,站台三可以为传送来的小盒子放入白色颗粒,站台四可以为传送来的小盒子放入绿色颗粒。我给的PLC指令是,导入黑色盒子,然后在站台二向黑色盒子放入黑色颗粒,站台三向黑色盒子放入白色颗粒,站台四不放颗粒。 我想实现的功能如下。

1. 如果我的指令有变化,比如说导入白色盒子,同时向白色盒子导入黑色和白色颗粒,如何实现? 当然我可以直接更改PLC 的指令,但是我想实现的功能是系统读取一个文档,然后让系统自动决策如何用PLC更改指令。 

2. 还有就是如果系统收到的命令是导入红色盒子,红色盒子在系统中不存在,如何让系统自动报错?

我的想法是用强化学习,Agent就是小盒子, 环境就是我设置的各种指令,比如文档是A,那么系统的行为就是B, 文档是C,系统的行为就是D。请各位专家帮我看看,想法是否正确?我想先从最简单的强化学习模型入手,专家有没有相应的强化学习模型推荐呢?还有就是做强化学习,我是否需要搭建一个模拟环境呢?

 

视情况而定,可追加奖励。提前谢谢各位专家了。

  • 写回答

1条回答 默认 最新

  • 憧憬blog 2023-03-14 18:55
    关注

    感谢您的提问,我来为您解答。

    针对您的第一个问题,如果您想要实现系统自动根据读取的文档来更改PLC指令,可以采用强化学习的方法。您的想法是正确的,Agent可以是小盒子,环境可以是指令设置,文档A可以对应着行为B,文档C可以对应着行为D。您可以设计一个强化学习模型,通过不断地尝试不同的行为(即不同的PLC指令),并根据系统的反馈(即小盒子放入颗粒的情况)来进行学习和优化。常见的强化学习模型包括Q-learning、Deep Q Network(DQN)等。不同的模型适用于不同的场景,您可以根据实际情况选择适合您的模型。

    针对您的第二个问题,如果系统收到的命令是导入不存在的红色盒子,可以通过在系统中设置一个判断机制来实现自动报错。例如,您可以在程序中添加一个判断红色盒子是否存在的函数,如果不存在则触发错误提示。

    至于您是否需要搭建一个模拟环境,这也视情况而定。如果您只是想验证强化学习模型的有效性,可以使用模拟环境模拟实际情况来进行测试。如果您要进行实际应用,就需要在现实环境中进行测试和优化。具体的实现细节还需要根据具体情况进行设计。

    希望我的回答能够帮助到您,如果您还有其他问题,欢迎继续咨询。

    评论

报告相同问题?

悬赏问题

  • ¥15 求指导ADS低噪放设计
  • ¥15 CARSIM前车变道设置
  • ¥50 三种调度算法报错 有实例
  • ¥15 关于#python#的问题,请各位专家解答!
  • ¥200 询问:python实现大地主题正反算的程序设计,有偿
  • ¥15 smptlib使用465端口发送邮件失败
  • ¥200 总是报错,能帮助用python实现程序实现高斯正反算吗?有偿
  • ¥15 对于squad数据集的基于bert模型的微调
  • ¥15 为什么我运行这个网络会出现以下报错?CRNN神经网络
  • ¥20 steam下载游戏占用内存