在预训练的谷歌新闻向量上重新训练word2vec



我正在进行一个实验,我想知道是否有可能只使用我想要的超参数来重新训练word2vec Google新闻向量。并将我想要的值分配给这些超参数。 谢谢

不是真的,因为他们没有分享他们使用的确切语料库。

如果你更喜欢自己的语料库——因为它包含更多的单词,或者适合你的应用程序的词义,甚至只是因为它是你唯一拥有的东西——你真的不需要"重新训练"其他向量,你可以从头开始制作你自己的。

可能有一些方法可以将这些向量注入到模型中以实现"快速启动",但这会增加复杂性,从而带来不明确的好处。如果你的语料库有任何好处,甚至可能比用于GoogleNews的语料库更适合你的目的,那么混合其中的影响可能会很复杂,而没有净收益。

最新更新