小贝子编程

使用 ray 的 PPO 算法处理事件时出错

本文关键字：处理事件出错算法 PPO ray 使用 flow-project
更新时间 : 2023-09-15
英文 : Error processing event with use of ray's PPO algorithm

我正在使用由ray提供的PPO算法来训练RL代理以稳定流量。在训练过程中，我一直看到 ValueError("观察超出预期值范围"，Box(500，( 屏幕截图

但是，我不知道我的脚本的哪个部分导致了这个问题，或者它是否是由流引起的？

是的，这是由 RLlib 升级引起的一个非常小的错误。基本上，我们过去使用的 Ray 版本对限制观察空间的边界并不严格，但新版本的 Ray 确实如此。您可以通过进入相应的环境并将观察空间的低值和高值更改为稍微宽松一点来解决此问题(例如，-2 到 2 而不是当前的 -1 到 1(

最新更新

在使用相同group_id的kafka消费者中使用assign而不是subscribe是否有影响? &
让谷歌的见解清楚地表明，我的网站上有不止一个页面
我无法在反应中删除 html 标签
获取/读取邮件消息并输出纯文本
显示:表格单元格与行号不对齐
如何使用Toga应用访问Android通知
访问create_template_view api时出现INVALID_REQUEST_BODY错误
使用预处理器条件生成C/ c++变量名
此处映射计算路线API上的错误414
Oracle数据库中的并行提示
woocommerce在每个类别结帐后自定义重定向
是否有可能在AWS中设置一个webhook来监控特定的电子邮件地址，并将接收到的电子邮件信息传递给Lambda?<
仅使用numpy实现CNN时出错
过程展开不规则时间序列
插入多个带别名的外键
如何从API响应中提取Array
WebLogic 14c -性能调优测试
Google-Drive-API文件没有使用FORM_ID找到
尝试创建一个伸缩盒容器，但它不会创建盒子并显示文本
是否有一种方法(最好是R)从BirdLife数据区自动提取信息?
为什么process.env.JWT_EXPIRE未被发现?js筑巢
Python记录器没有从根记录器继承level
是什么导致了python的f字符串中"f "{a}""与"f "{a=}""之间的差异？
标题库使用介子
打印偶数的"count"，而循环使用 if
为什么我要将数组转换为对象
通过共享操作符将可连接的Flux转换为Hot不工作
从演示文稿中删除所有空的/未使用的形状
破坏错误取决于变量的顺序
c -试图编写一个MIPS汇编程序

使用 ray 的 PPO 算法处理事件时出错

相关内容

最新更新

热门标签：