BetaDu 2022-08-05 23:16 采纳率: 25%
浏览 67
已结题

强化学习自定义gym环境状态空间的表示?

   我最近在用强化学习DQN算法解非线性整数规划问题。
   state是一个三维的整数数组[a,b,N]a取值[0,4] , b取值[0,2]。但是其中N的取值范围取决于aN=[1, math.floor(2000/3/a)],也就是N取值范围有5种,所以状态空间无法用 Box() 直接表示,不知道大佬能否指点一下,如何表示状态空间呀?
  • 写回答

2条回答 默认 最新

  • CSDN-Ada助手 CSDN-AI 官方账号 2022-08-06 06:01
    关注
    建议你看下这篇博客Gym强化学习自定义环境的搭建
    评论

报告相同问题?

问题事件

  • 系统已结题 8月13日
  • 创建了问题 8月5日

悬赏问题

  • ¥15 Opencv(C++)异常
  • ¥15 VScode上配置C语言环境
  • ¥15 汇编语言没有主程序吗?
  • ¥15 这个函数为什么会爆内存
  • ¥15 无法装系统,grub成了顽固拦路虎
  • ¥15 springboot aop 应用启动异常
  • ¥15 matlab有关债券凸性久期的代码
  • ¥15 lvgl v8.2定时器提前到来
  • ¥15 qtcp 发送数据时偶尔会遇到发送数据失败?用的MSVC编译器(标签-qt|关键词-tcp)
  • ¥15 cam_lidar_calibration报错