如何删除张量流中的连续重复项?

例如，输入一个一维张量：

l_in = [1,1,2,2,3,4,5,5,1,3,5]

我想删除连续的重复项，这意味着输出应该是：

l_out = [1,2,3,4,5,1,3,5]

但是，tf.unique函数仅返回唯一元素，表明最后三个元素也将被删除。tf.unique的输出为：

[1,2,3,4,5], [0,0,1,1,2,3,4,4,0,2,4] = tf.unique(l_in)

其中第二项是相应的 ID。

有没有办法只删除连续的重复项，同时保留非重复和非唯一的元素？

对于一维张量，使用数组旋转/移位：

import tensorflow as tf
l_in = tf.constant([1,1,2,2,3,4,5,5,1,3,5])
l_left_shift = tf.concat((l_in[1:], [0]), axis=0)
mask_left_shift = tf.not_equal(l_in - l_left_shift, 0)
mask = tf.concat(([True], mask_left_shift[:-1]), axis=0)
l_out = tf.boolean_mask(l_in, mask)
with tf.Session() as sess:
print(sess.run(l_out))
# [1 2 3 4 5 1 3 5]

(即这个想法是用它的右邻居减去每个元素，如果减法结果为 0，则屏蔽邻居)

不知道 tensorflow，但由于它似乎是一个简单的列表，你可以很容易地从 itertools 中使用 groupby：

from itertools import groupby  
l_out = [x[0] for x in groupby(l_in)]
print(l_out) # prints [1, 2, 3, 4, 5, 1, 3, 5]

另请参阅：删除在 Python 中具有连续重复项的元素

相关内容

最新更新

热门标签：