与word2vec的余弦相似性没有给出良好的文档相似性



为什么余弦相似性与单词嵌入不能提供良好的输出。。。它给出了新文献与大多数历史文献的相似性值。。尽管两份文件的不相似

余弦相似性根据两个向量之间的角度给出了它们的相似程度。

如何构造文档的嵌入?因为word2vec只会给你单词的嵌入?

大多数人使用tf idf作为对文档进行排名的度量。

最新更新