while True:
# 画图
if arg_dict['train_render']:
env.render()
# 根据e-贪心策略获取动作
action = agent.sample_action(state)
# 执行动作,获得下一个状态、奖励和是否结束当前回合的标志,并更新环境
result = env.step(action)
print(env.step(action))
next_state, reward, done, _ = env.step(action)
错误为最后一行
输出为(36, -1, False, False, {'prob': 1.0})
ValueError: too many values to unpack (expected 4)
result那行是自己想找一下对应的量有几个,请问大家知不知道怎么改?俺刚接触Python。