我正在开发一个基于DQN的自治代理。我正在使用健身房库来制作我想要测试的环境,但我一直在处理状态的框架。健身房环境使用FrameStack包装返回的状态具有以下观察空间:
env = gym.make('Bowling-v0')
env = gym.wrappers.FrameStack(env, 4)
print(env.observation_space)
Box(0, 255, (4, 210, 160, 3), uint8)
我希望观察空间为Box(0, 255, (4, 88, 80, 1), uint8)
。我该怎么办?我试着使用另一个类似的包装器:
env = gym.wrappers.ResizeObservation(env, (4, 88, 80, 1))
print(env.observation_space)
但得到的观测空间是CCD_ 2。我做错了什么?
已修复!我只是做的方式不对。
env = gym.make('Bowling-v0')
print(env.observation_space)
Box(0, 255, (210, 160, 3), uint8)
必须首先应用调整大小,然后仅在调整大小之后应用堆叠!
env = gym.wrappers.ResizeObservation(env, (88, 80))
print(env.observation_space)
Box(0, 255, (88, 80, 3), uint8)
所以现在我们可以使用FrameStack包装进行堆叠
env = gym.wrappers.FrameStack(env, 4)
print(env.observation_space)
Box(0, 255, (4, 88, 80, 3), uint8)