小贝子编程

网格世界的深度Q学习

本文关键字：学习深度世界网格 reinforcement-learning dql q-learning dqn
更新时间 : 2023-09-19
英文 : Deep Q-Learning for grid world

是否有人实现了深度Q学习来解决网格世界问题，其中状态是玩家的[x，y]坐标，目标是达到某个坐标[a，B]。奖励设置可以是每一步-1，达到[A，B]可以是+10。[A，B]总是固定的。

令人惊讶的是，我没有在谷歌上找到这样的实现。我自己用taxi-v3尝试了DQN，但没有成功。因此，寻找这样一个参考实现来解决我的问题。

对于网格世界来说，不需要深度Q学习，这可能就是为什么很少有人这样做的原因。然而，我发现了一个在网格世界中使用深度Q学习的教程：https://livebook.manning.com/book/deep-reinforcement-learning-in-action/chapter-3/1

最新更新

仅使用CSS在单选按钮选中后切换div内容
从列表中自动创建多个Google工作表
在django上处理select multiple
Guid在视图页面中显示空字符串.净MVC)
所有大写字母和所有非字母字符的正则表达式是什么
Python Pyparsing Located vs locatedExpr
c#中具有列表值的字典的类型转换
c++继承模板特化
为什么我的flappy bird游戏只加载图像?
如何使用Maven从pom.xml中访问settings.xml中的元素?
错误：不支持 -： 'list' 和'int'的操作数类型
我的输出总是相同的，但我应该根据我输入的数字给出不同的答案"efektywnosctypu"
Web抓取:重复的类名意味着我无法从网站指定所需的数据
std::process，从缓冲区中读取标准输入和标准输出
缺少 1 个必需的位置参数：'self'
如何编写在KDB查询中使用列的函数?
TFX 的评估器组件无法准备评估输入
谷歌AI视觉/图像标签?
如何使用套接字.在反应中?
在macOS中，如何获取'.安装"Oh-My-Zsh"框架后，将其替换为其配置文件?
当它可以在CMD上工作时，我如何运行此函数
集成Flask/Dill来转储/加载服务器会话
如何通过附加异构列值来创建数据框架
如何在RecyclerView中保持相同的位置，即使在从Firestore获取更新的数据之后
我如何做Vue.set()在Vue 3?
Gradle同步失败时创建新的kotlin项目:(ModuleVersionResolveException)
vue js过滤搜索栏
完全卸载自制程序
尝试在go中使用通道，但数据无法正确发送/接收到通道
在析构函数中调用join()时的不一致行为

网格世界的深度Q学习

相关内容

最新更新

热门标签：