向量空间模型介绍



VSM(向量空间模型)有哪些不同类型?

我知道的一个(根据维基)是tf-idf(此方法中使用余弦相似性,但它不是一个单独的方法)。还有哪些其他方法?

另外,在wiki中谈论的文档中的单词(频率除外)的不同维度是什么?

VSM 是否有任何层次结构?

附言如果我在任何地方都错了,请纠正我...

看看论文 从频率到意义:语义的向量空间模型 - 语义向量空间模型调查。有关频率的特定问题,请参阅第 4.2 和 4.3 节:简而言之,使用 tf-idf、PMI、PPM 并进行进一步平滑(主要是通过 SVD 的一些变体)。

但是,由于这项调查的日期是2010年,因此没有提到基于深度学习的VSM,请参阅论文。

最新更新