如何使用预先训练的模型权重初始化新的 word2vec 模型



我正在使用python中的Gensim库来使用和训练word2vector模型。最近,我正在考虑使用一些预先训练的word2vec模型初始化我的模型权重,例如(GoogleNewDataset预训练模型)。几个星期以来,我一直在为此苦苦挣扎。现在,我刚刚搜索到在 gesim 中有一个函数可以帮助我使用预先训练的模型权重初始化模型的权重。如下所述:

reset_from(other_model)
    Borrow shareable pre-built structures (like vocab) from the other_model. Useful if testing multiple models in parallel on the same corpus.

我不知道这个函数是否可以做同样的事情。 请帮忙!!

你现在可以使用 gensim 进行增量训练。我建议加载预训练模型,然后进行更新。

from gensim.models import Word2Vec
model = Word2Vec.load('pretrained_model.emb')
model.build_vocab(new_sentences, update=True)
model.train(new_sentences)

最新更新