如何在稳定的基线中拥有多个动作空间。我的动作空间是Discrete和Box的组合。我试过gym.spaces.Tuple([gym.spaces.cDiscrete(5(,gym.space.Box(low=0.001,high=1.0,shape=(1,(](和gym.spacesDict,但脚本似乎冻结了,没有任何错误或警告。我正在使用sb3 的PPO2
不幸的是,稳定的基线3不适用于字典(或元组(。您只能使用Box、Discrete、MultiDiscrete和MultiBinary