小贝子编程

我可以在深度q学习中给动作传递约束吗?

本文关键字：约束深度学习我可以 python tensorflow reinforcement-learning agent dqn
更新时间 : 2023-09-22
英文 : Can I pass constraints to actions in deep q learning python?

目前我正在使用RL代理DQN来预测动作和更新动作值函数。但是如果我有一个约束来运行一个特定的动作n次，我能在DQN中有一个约束来指定代理执行动作吗?如果是，我怎么可能做到(使用TF)?

提前谢谢你

重复n步。如果你使用的是健身房的环境，也可以使用SuperSuit之类的包装器。SuperSuit为此提供了sticky_actions_v0或frame_skip_v0。

最新更新

用 C 语言编写纸牌游戏"War"
AWS中的 s3访问触发器
如何用API调用返回的数据填充Angular Boostrap Table Widget ?
HTML CSS -在表格单元格中心像弹出一样缩放div
在docker桌面列表中持久化容器/应用
Apache AuthLDAPBindDN指令接受任何字段?
id(String)方法调用允许在插件{}脚本块错误
python中的类、属性和方法
为什么float是准确的，Decimal是错误的
数据类型问题从Synapse到Delta表在Databricks?
使用列表值创建二进制矩阵
如何为被轻敲的键和被保持1000毫秒的键制作不同的热键
在MVVM Jetpack Compose上添加依赖项时重复类错误
列表理解不会消除重复项
Windows -有效地将大量数据打印到终端
R函数转换为HTML
裸机中的 Kubernetes 证书管理器问题：等待 HTTP-01 质询传播：状态代码"403"错误，预期'200'
使用钩子将状态从一个组件传递到另一个组件(不是子组件)
当我们使用暂存标志(--暂存)进行"npm build"时，如何在应用程序中创建"NON PRODUCTION"横幅？
循环访问列表，为每个项目创建新列表，然后将新列表作为参数传递给函数，但"var referenced before assignment"
React单元测试Jest使用Typescript mount()的问题
是否有一种方法来隐藏代码使用Swift包管理器?
如何限制游戏循环fps?
Django将更复杂的python类型传递给模板
r语言 - 创建可使用元素访问的响应值列表
ECharts Apache:条形图-添加水平水平线
aws Cloudfront的维护页面
是否有任何方法为我的php应用程序从计算机到整个互联网?
根据指定值计算集合中所有可能的值组合
如何将Django模型限制为单个一对一关系?

我可以在深度q学习中给动作传递约束吗?

相关内容

最新更新

热门标签：