BetaDu 2022-08-05 23:16 采纳率: 25%
浏览 68
已结题

强化学习自定义gym环境状态空间的表示?

   我最近在用强化学习DQN算法解非线性整数规划问题。
   state是一个三维的整数数组[a,b,N]a取值[0,4] , b取值[0,2]。但是其中N的取值范围取决于aN=[1, math.floor(2000/3/a)],也就是N取值范围有5种,所以状态空间无法用 Box() 直接表示,不知道大佬能否指点一下,如何表示状态空间呀?
  • 写回答

2条回答 默认 最新

  • CSDN-Ada助手 CSDN-AI 官方账号 2022-08-06 06:01
    关注
    建议你看下这篇博客Gym强化学习自定义环境的搭建
    评论

报告相同问题?

问题事件

  • 系统已结题 8月13日
  • 创建了问题 8月5日