我们如何定义一个 RNN - LSTM 神经网络,在时间"t"处为输入提供多个输出?



我正在尝试构建一个RNN来预测玩家参加比赛的可能性以及玩家的跑动得分和三柱门。我会使用 LSTM,这样当前比赛中的表现就会影响玩家未来的选择。

架构摘要:

输入功能:比赛详情 - 场地、参赛球队、击球优先

输入样本:两支球队的球员名单。

输出:

  1. 离散:二进制:玩家玩过吗。
  2. 离散:采取的检票口。
  3. 连续:运行得分。
  4. 连续:球投球。

问题:

  1. 大多数情况下,RNN 在最后层中使用"Softmax"或"MSE"来处理来自 LSTM 的"a"——仅提供单个变量"Y"作为输出。但这里有四个因变量(2个离散变量和2个连续变量)。是否可以将所有四个拼接在一起作为输出变量?
  2. 如果是,我们如何处理具有损失函数的连续和离散输出的混合?

(虽然 LSTM "a" 的输出具有多个特征并将信息传递到下一个时隙,但我们需要在输出时有多个特征来基于基本事实进行训练)

你只是这样做。如果没有有关正在使用的软件(如果有的话)的更多详细信息,就很难提供更多的 detasmail

LSTM 单元的输出在网络隐藏层的每次踏上时都会出现

然后,您可以将其输入到 4 个输出层中。

1 个 S 形 2 我发现这个阿比特。也许 4x sigmoid(一局 4 个小门对吧?或 relu4 3,4 线性 (平方 它是 LSO 一个选项,e 或 relu)

出于训练目的,您的损失函数是 4 个个体损失的总和。 由于 f 它们都是 MSE,因此您可以在计算损失之前连接 4 个输出。

但是第一个是交叉熵(对于决策 sigmoid)你单独计算和求和。 您仍然可以在之后将它们连接起来以获得输出向量

最新更新