我想利用word2vec预训练向量来对段落进行分类。我可以从中提取任何众所周知的良好功能吗?我读过,对文章中所有单词的向量求平均值可能很有用。在这里: https://github.com/Poyuli/sentiment.analysis
有没有地方可以找到一个很好的一般性讨论,以充分利用谷歌提供的预训练word2vec向量?
"
平均"是一种有效的文本分类方法。
我可以建议你尝试斯坦福GloVe工具,它可以完成与word2vec相同的工作。
它有自己的预先训练的词向量。您可以查看此站点 http://nlp.stanford.edu/projects/glove/