我正在进行一个实验,我想知道是否有可能只使用我想要的超参数来重新训练word2vec Google新闻向量。并将我想要的值分配给这些超参数。 谢谢
不是真的,因为他们没有分享他们使用的确切语料库。
如果你更喜欢自己的语料库——因为它包含更多的单词,或者适合你的应用程序的词义,甚至只是因为它是你唯一拥有的东西——你真的不需要"重新训练"其他向量,你可以从头开始制作你自己的。
可能有一些方法可以将这些向量注入到模型中以实现"快速启动",但这会增加复杂性,从而带来不明确的好处。如果你的语料库有任何好处,甚至可能比用于GoogleNews的语料库更适合你的目的,那么混合其中的影响可能会很复杂,而没有净收益。