小贝子编程

DQN 状态值是否只需要为 0 到 1

本文关键字：状态是否 DQN python deep-learning reinforcement-learning q-learning dqn
更新时间 : 2023-09-16
英文 : should dqn state values need to be 0 to 1 only

例如，DQN 中的状态值只需要 0 到 1 状态 = [

0， 0， 0， 1， 1， 1， 1， 0， 1， 0]或者它可以具有值大于 1 EH 的状态状态 = [6， 5， 4， 1， 1， 1， 2， 3， 15， 10]

状态本身不需要在价值上受到限制。您可以拥有任意大的范围。但出于训练目的，建议将状态值归一化在 [0,1] 范围内，以便神经网络使用的函数近似不会饱和。

最新更新

TYPO3 v11.5 #1578950324 RuntimeException -给定的页面记录无效.失踪的uid.B
如何使WebGPU运行在Chrome金丝雀97?
我想通过input split将其分为command, key, value，并输入到字典中
仅使用CSS在单选按钮选中后切换div内容
从列表中自动创建多个Google工作表
在django上处理select multiple
Guid在视图页面中显示空字符串.净MVC)
所有大写字母和所有非字母字符的正则表达式是什么
Python Pyparsing Located vs locatedExpr
c#中具有列表值的字典的类型转换
c++继承模板特化
为什么我的flappy bird游戏只加载图像?
如何使用Maven从pom.xml中访问settings.xml中的元素?
错误：不支持 -： 'list' 和'int'的操作数类型
我的输出总是相同的，但我应该根据我输入的数字给出不同的答案"efektywnosctypu"
Web抓取:重复的类名意味着我无法从网站指定所需的数据
std::process，从缓冲区中读取标准输入和标准输出
缺少 1 个必需的位置参数：'self'
如何编写在KDB查询中使用列的函数?
TFX 的评估器组件无法准备评估输入
谷歌AI视觉/图像标签?
如何使用套接字.在反应中?
在macOS中，如何获取'.安装"Oh-My-Zsh"框架后，将其替换为其配置文件?
当它可以在CMD上工作时，我如何运行此函数
集成Flask/Dill来转储/加载服务器会话
如何通过附加异构列值来创建数据框架
如何在RecyclerView中保持相同的位置，即使在从Firestore获取更新的数据之后
我如何做Vue.set()在Vue 3?
Gradle同步失败时创建新的kotlin项目:(ModuleVersionResolveException)
vue js过滤搜索栏

DQN 状态值是否只需要为 0 到 1

相关内容

最新更新

热门标签：