小贝子编程

如何找到两个keras pad_sequence之间的接近度

我正在编写一个小的概念验证，将目录转换为一个json，该json有一个url和一个解释网页的标签。我在python中阅读了这个json，将其标记化并创建一个pad_sequences。

然后，我需要比较一些自由流文本，以找出pad_sequences的哪个索引包含自由流文本中最多的单词。

我也在从文本中生成pad_sequences((，但不确定是否可以以某种方式比较这两个序列的接近度？

请帮忙。

您可以使用余弦相似度或欧氏距离来比较两个向量。

https://www.tensorflow.org/api_docs/python/tf/keras/metrics/CosineSimilarity

https://www.tutorialexample.com/calculate-euclidean-distance-in-tensorflow-a-step-guide-tensorflow-tutorial/

对于序列，可以先嵌入到相同长度的向量中。

相关内容