我最近在用强化学习DQN算法解非线性整数规划问题。
state是一个三维的整数数组[a,b,N],a取值[0,4] , b取值[0,2]。但是其中N的取值范围取决于a,N=[1, math.floor(2000/3/a)],也就是N取值范围有5种,所以状态空间无法用 Box() 直接表示,不知道大佬能否指点一下,如何表示状态空间呀?
强化学习自定义gym环境状态空间的表示?
- 写回答
- 好问题 0 提建议
- 追加酬金
- 关注问题
- 邀请回答
-
2条回答 默认 最新
悬赏问题
- ¥15 Opencv(C++)异常
- ¥15 VScode上配置C语言环境
- ¥15 汇编语言没有主程序吗?
- ¥15 这个函数为什么会爆内存
- ¥15 无法装系统,grub成了顽固拦路虎
- ¥15 springboot aop 应用启动异常
- ¥15 matlab有关债券凸性久期的代码
- ¥15 lvgl v8.2定时器提前到来
- ¥15 qtcp 发送数据时偶尔会遇到发送数据失败?用的MSVC编译器(标签-qt|关键词-tcp)
- ¥15 cam_lidar_calibration报错