小贝子编程

在预训练的谷歌新闻向量上重新训练word2vec

我正在进行一个实验，我想知道是否有可能只使用我想要的超参数来重新训练word2vec Google新闻向量。并将我想要的值分配给这些超参数。谢谢

不是真的，因为他们没有分享他们使用的确切语料库。

如果你更喜欢自己的语料库——因为它包含更多的单词，或者适合你的应用程序的词义，甚至只是因为它是你唯一拥有的东西——你真的不需要"重新训练"其他向量，你可以从头开始制作你自己的。

可能有一些方法可以将这些向量注入到模型中以实现"快速启动"，但这会增加复杂性，从而带来不明确的好处。如果你的语料库有任何好处，甚至可能比用于GoogleNews的语料库更适合你的目的，那么混合其中的影响可能会很复杂，而没有净收益。

相关内容