定义一个函数以在运行阶段之前迭代张量



我正在定义一个损失函数,我必须在其中迭代张量的值。当然,这是一个在训练阶段之前编码的 python 函数,我正在努力了解如何在张量上定义 for 循环。在这个张量中,有一些零和其他数字,但我不知道有多少,这取决于当前批次的训练文件。可能是 2、5、10、...我不知道,所以我不能使用固定值。这里有一个例子

points = tf.constant([[[0], [1], [0], [2], [1], [0], [2], [2], [0], [1]],
[[1], [2], [0], [0], [1], [0], [1], [2], [0], [2]],
[[0], [2], [1], [0], [2], [0], [1], [2], [0], [1]]], dtype=tf.float32)
max_indices = tf.reduce_max(points[:1])
for index in xrange(max_indices): # error here
# do stuff

这是错误

TypeError: an integer is required

所以我尝试了另一种方式使用它

points = tf.constant([[[0], [1], [0], [2], [1], [0], [2], [2], [0], [1]],
[[1], [2], [0], [0], [1], [0], [1], [2], [0], [2]],
[[0], [2], [1], [0], [2], [0], [1], [2], [0], [1]]], dtype=tf.float32)
items, _ = tf.unique(tf.reshape(points[:1], [-1]))
for item in tf.unstack(items): # error here
# do stuff

错误是

ValueError: Cannot infer num from shape (?,)

当然,给出这些错误是因为在定义阶段我没有值,但我不知道如何修复它。

我假设基于"在定义阶段我没有值",当您需要迭代数据集时,您正在会话中。

您可以使用tf.while_loop(cond, body, loop_vars)并将结束条件添加到每个张量的末尾。这应该是一些不会显示在数据集中的值。例如,如果数据集仅包含正实数,则可以使用-1作为最终条件。

基本上,tf.while_loop(cond, body, loop_vars)首先调用cond,它应该返回一个布尔张量。同时,如果cond不返回 false,则将使用loop_vars调用body。请注意,要在循环中使用的所有内容都应包含在loop_vars中。全局变量和loop_vars上下文之外的变量将不起作用。

因此,您可以将t = tf.constant(0)用作时间步长,并在每次通过body递增它。然后,在cond中,您可以使用x[t]在每次迭代时获取值,以检查数据集x是否等于最终条件。如果它等于这个结束条件,你已经完全迭代了你的张量,cond应该返回 false。否则,cond应返回 true,然后可以使用t作为某些数据集的迭代器,xbody中使用x[t]

这就是我用来解决在 RNN 中迭代可变长度句子的方法。我用<end>作为我的最终条件,它的效果很好。我希望这也对你有用!

最新更新