问题遇到的现象和发生背景
题主最近在学习 DDPG,如果Pendulum中的钟摆运动,只有一个钟摆,以及一个动作的表现形式,左右一个力。力是处在同一个平面上的。
添加一个动作特征:
将在通一平面上的力(或者说是在二维空间中的力)-->扩展到 空间中的力(或者说三维空间的力)。
我们可以从任意一个角度给定一个力。
因此该力需要一个三维坐标轴来表示。
【变形后的钟摆】也需要三维坐标来表示当前的状态呢!对于 当前的结果 ,可以用 DDPG来解决问题。
我想知道:数据扩充一个维度后,对于模型训练有啥影响吗?对于上述【变形后的钟摆】,如果再添加两个【变形钟摆】,且【变形钟摆】之间可能由于碰到,会产生内部总用。当前问题,是否可以忽略 内部作用力,继续用DDPG来解决呢?也就是增加一个“智能体的个数维度”呢!!!