如何找到两个keras pad_sequence之间的接近度



我正在编写一个小的概念验证,将目录转换为一个json,该json有一个url和一个解释网页的标签。我在python中阅读了这个json,将其标记化并创建一个pad_sequences。

然后,我需要比较一些自由流文本,以找出pad_sequences的哪个索引包含自由流文本中最多的单词。

我也在从文本中生成pad_sequences((,但不确定是否可以以某种方式比较这两个序列的接近度?

请帮忙。

您可以使用余弦相似度或欧氏距离来比较两个向量。

https://www.tensorflow.org/api_docs/python/tf/keras/metrics/CosineSimilarity

https://www.tutorialexample.com/calculate-euclidean-distance-in-tensorflow-a-step-guide-tensorflow-tutorial/

对于序列,可以先嵌入到相同长度的向量中。

最新更新