目标:在稳定基线3中,我希望能够在我的环境中并行运行多个工作程序(多处理(来训练我的模型。
方法:如此Google Colab所示,我相信我只需要运行以下代码行:
vec_env=make_vec_env(env_id,n_envs=num_cpu(
但是,我有一个自定义环境,它没有env_id。所以,当我运行它就像";make_vec_env(MyEnvironment((,n_envs=3(";,我收到一个错误,说我的环境不可调用。这方面似乎普遍缺乏文档,但根据我从这个线程中收集到的信息,我需要向Gym注册我的自定义环境,以便我可以使用make_vec_env((函数调用它。
我的第一个问题是:有没有其他方法可以在自定义环境中运行多个工作者?如果不是。。。
我的第二个问题:如何在Gym注册我的自定义环境?
同样,文档似乎有些缺乏。我找到了这一、二、三个概述步骤的帖子。然而,我不明白——我可以把这个文件夹放在我想要的任何地方吗?健身房怎么知道在哪里可以找到它?为什么我需要两个init.py文件?
任何指导都将不胜感激。
您可以通过注册自定义env来解决这个问题,我们称之为myEnv。假设您将先前定义的数据帧传递给类的构造函数,它看起来如下:
class myEnv:
def __init__(self, myFancyDF: pd.DataFrame):
...
...
你可以通过在同一代码中的定义后面有这个来做到这一点:
myEnv_id = 'optionalSpaceName/myEnv-v0' # It is best practice to have a space name and version number.
gym.envs.registration.register(
id=myEnv_id,
entry_point=myEnv,
max_episode_steps=20000, # Customize to your needs.
reward_threshold=500 # Customize to your needs.
)
现在您可以创建一个矢量env与:
vec_env = make_vec_env(myEnv_id, n_envs=100, seed=0, env_kwargs={"myFancyDF": myFancyDF})