LSTM一对多模型输出相对于r.t输入的梯度



我有一个LSTM模型,它以向量x0(维度:n(为输入,并返回向量序列(大小:T x n(。我需要每个序列的导数w.r.t x0(大小:n x n(。因此,我需要一个大小为(T x n x n(的雅可比矩阵。在TensorFLow中,最有效的方法是什么。我需要这个来进行优化研究,需要一个取x0并返回导数信息的函数。在搜索了所有可用的选项后,我没有任何好的方法来处理这个问题。任何帮助(psuedo代码、文档、帖子等(都将非常有益。

不完全确定这是否是您想要的,但Tensorflow具有良好的执行能力(允许交互式调试(和非常全面的梯度自动计算框架。这两者的结合可能会有所帮助。此链接包括一些详细信息和示例代码,这些信息和代码可能适合您的特定需求:https://www.tensorflow.org/guide/eager尤其是本节:https://www.tensorflow.org/guide/eager#computing_gradients以及帖子上的其他人。

我希望这能有所帮助。

最新更新