我在下面有两个词典:
word2int = {}
int2word = {}
for i,word in enumerate(words):
word2int[word] = i
int2word[i] = word
def euclidean_dist(vec1, vec2):
return np.sqrt(np.sum((vec1-vec2)**2))
def find_closest(word_index, vectors):
min_dist = 10000 # to act like positive infinity
min_index = -1
query_vector = vectors[word_index]
for index, vector in enumerate(vectors):
if euclidean_dist(vector, query_vector) < min_dist and not np.array_equal(vector, query_vector):
min_dist = euclidean_dist(vector, query_vector)
min_index = index
return min_index
我有一个输入字符串张量X
. 我想在word2int
中使用X
索引,如下所示:
X = tf.placeholder(tf.string)
find_closest_word = tf.convert_to_tensor(int2word[find_closest(word2int[X], vectors)], dtype=tf.string)
问题:
如何将字符串张量X
转换为 python 字符串,以便它可以用作 word2int 中的索引?
如何将字符串张量 X 转换为 python 字符串,以便它可以 在 word2int 中用作索引?
除非调用 sess.run(string_tensor)
,否则无法获取字符串值。
值得一提的是,有一种更干净的方法 将 id 转换为单词,反之亦然 index_table_from_file
.下面是如何使用它的示例。