具有外部评估功能的 Keras 培训

让我先描述一下设置：我们在 Unity 中有一个自治代理，其决策基于感知环境(级别(和一些预定义的值映射参数。我们的目标是在 DNN 中预训练代理的参数。因此，这个想法基本上是定义一个误差指标来评估 Unity 模拟中代理的性能(运行关卡，例如测量与最佳轨迹的偏差 = Unity 中的地面事实(。因此，根据 DNN 的输入级别，网络应该训练输出参数，执行模拟并将错误作为错误值(如准确性(传递回网络，以便网络可以根据该错误/性能进行训练。

在 Keras 之外的训练期间，有没有办法进行评估(与基本事实进行比较(？通常，人们将X数据传递给网络，训练东西并将其与基本事实Y进行比较。这适用于预测，但我不想预测某些东西。我想要的是测量模拟中与地面真相的偏差。我知道有Unity ML代理，但据我所知，"大脑"在运行时控制代理，即在每一帧上更新它并控制移动。我想要的是执行整个模拟来更新网络的参数/权重。

愿你安好。

在我的大学里做了一些演讲：设置不会以这种方式工作，因为我需要拆分进程。

我需要工作代理的参数来仅基于级别描述(例如，像视频游戏描述语言这样的矩阵(来训练网络。为了获得基于实际水平和真实数据(例如轨迹偏差(的参数化代理，需要使用带有评分函数的强化深度学习来获得这些参数。因此，Unity ML 代理可能很有用。之后，我可以使用参数设置和相关级别数据来训练网络，以仅根据级别描述生成所需的参数。

相关内容

最新更新

热门标签：