TensorFlow,什么时候可以使用类似Python的负索引?



我是TensorFlow(版本1.2(的新手,但不是Python或Numpy。 我正在建立一个模型来预测蛋白质分子的形状。 我需要将 TensorFlow 的标准tf.losses.cosine_distance函数包装在一些额外的代码中,因为我需要停止将一些 NaN 值传播到损失计算中。

我确切地知道哪些细胞将是NaN。 无论我的机器学习系统预测这些细胞是什么,都不算数。 我计划在总结损失函数之前将tf.losses.cosine_distance输出的 NaN 部分转换为零。

下面是一段工作代码,使用 tf.scatter_nd_update 进行元素分配:

def custom_distance(predict, actual):
with tf.name_scope("CustomDistance"):
loss = tf.losses.cosine_distance(predict, actual, -1, 
reduction=tf.losses.Reduction.NONE)
loss = tf.Variable(loss) # individual elements can be modified
indices = tf.constant([[0,0,0],[29,1,0],[29,2,0]])
updates = tf.constant([0., 0., 0.])
loss = tf.scatter_nd_update(loss, indices, updates)
return loss

但是,这只适用于我拥有的一种30个氨基酸长的蛋白质。 如果我的蛋白质长度不同怎么办? 我会有很多。 在 Numpy 中,我只会使用 Python 的负索引,并用 -1 代替索引行上的两个 29。 Tensorflow不会接受这一点。 如果我进行这种替换,我会得到很长的回溯,但我认为其中最重要的部分是:

File "/usr/local/lib/python3.5/dist-packages/tensorflow/python/framework/errors_impl.py", line 466, in raise_exception_on_not_ok_status
pywrap_tensorflow.TF_GetCode(status))
tensorflow.python.framework.errors_impl.InvalidArgumentError: Invalid indices: [0,1] = [-1, 1, 0] is not in [0, 30)

(我还可以修改预测张量,以便在计算损失之前使有问题的单元格与实际张量完全匹配,但在每种情况下,挑战都是相同的:在 TensorFlow 对象中分配单个元素的值。

我应该忘记TensorFlow中的负索引吗? 我正在仔细研究TensorFlow文档,以了解解决此问题的正确方法。 我假设我可以检索我的输入张量的长度长于主轴并使用它。 但是在看到TensorFlow和Numpy之间的强烈相似之处之后,我不得不怀疑这是否笨拙。

感谢您的建议。

它可以与 tensorflow 与 python 切片运算符的绑定一起使用。例如,loss[-1]loss的有效切片。

在您的情况下,如果只有三个切片,则可以单独分配它们:

update_op0 = indices[0,0,0].assign(updates[0])
update_op1 = indices[-1,1,0].assign(updates[1])
update_op2 = indices[-1,2,0].assign(updates[2])

如果切片数超过此值,或者切片数量可变,则前面的方法不切实际。您可以像这样编写一个小的辅助函数,将"正或负索引"转换为"仅正索引":

def to_pos_idx(idx, x):
# todo: shape & bound checking
idx = tf.convert_to_tensor(idx)
s = tf.shape(x)[:tf.size(idx)]
idx = tf.where(idx < 0, s + idx, idx)
return idx

并像这样修改你的代码:

indices = tf.constant([[0,0,0],[-1,1,0],[-1,2,0]])
indices = tf.map_fn(lambda i: to_pos_idx(i, loss), indices) # transform indices here
updates = tf.constant([0., 0., 0.])
loss = tf.scatter_nd_update(loss, indices, updates)

最新更新