具有外部评估功能的 Keras 培训



让我先描述一下设置: 我们在 Unity 中有一个自治代理,其决策基于感知环境(级别(和一些预定义的值映射参数。我们的目标是在 DNN 中预训练代理的参数。因此,这个想法基本上是定义一个误差指标来评估 Unity 模拟中代理的性能(运行关卡,例如测量与最佳轨迹的偏差 = Unity 中的地面事实(。因此,根据 DNN 的输入级别,网络应该训练输出参数,执行模拟并将错误作为错误值(如准确性(传递回网络,以便网络可以根据该错误/性能进行训练。

在 Keras 之外的训练期间,有没有办法进行评估(与基本事实进行比较(?通常,人们将X数据传递给网络,训练东西并将其与基本事实Y进行比较。这适用于预测,但我不想预测某些东西。我想要的是测量模拟中与地面真相的偏差。 我知道有Unity ML代理,但据我所知,"大脑"在运行时控制代理,即在每一帧上更新它并控制移动。我想要的是执行整个模拟来更新网络的参数/权重。

愿你安好。

在我的大学里做了一些演讲: 设置不会以这种方式工作,因为我需要拆分进程。

我需要工作代理的参数来仅基于级别描述(例如,像视频游戏描述语言这样的矩阵(来训练网络。为了获得基于实际水平和真实数据(例如轨迹偏差(的参数化代理,需要使用带有评分函数的强化深度学习来获得这些参数。因此,Unity ML 代理可能很有用。之后,我可以使用参数设置和相关级别数据来训练网络,以仅根据级别描述生成所需的参数。

最新更新