在Ray RLLib中继续训练,即使环境抛出异常



有时,在选择了几个错误的操作后,环境可能会遇到无法处理的情况,从而产生异常。

与其使代理崩溃,不如重试并忽略该事件。

如何实现这一点?

From the docs:

以max_failures=-1作为参数调用tune.run将尝试无限次地恢复试验,例如:

tune.run(algorithm_name,
config=config_dict,
max_failures=-1)

最新更新