多模型平均Word2vec Gensim



我在Python的GensimWord2Vec中训练了几百万个单词。我想用新数据更新这个训练好的模型。但是从你以前的帖子和网络上的其他来源,我知道这是不可能的。所以我试着创建多个模型并抛弃它们。现在我想合并我要抛弃的模型。我想用这些被抛弃的结果。在Word2Vec中合并预训练模型?但我不知道怎么做。我知道有一个叫做deepdist的图书馆,我想看看周围的一些实验:

model = word2vec.Word2Vec.load_word2vec_format('/tmp/vectors.bin', binary=True)
  1. 有可能的解决方案吗?
  2. 如果有,请建议如何做?

我在Windows 7专业版上使用Python2.7。

您指出的答案并不建议合并模型作为解决方案。实际上,他们建议你分别使用不同的模型。对每个模型进行预测,然后将答案组合起来。有几种方法可以组合输出。在你的例子中,你提到你有几个模型,所以你可以忽略他们建议将你的训练数据分成2个,以便实际上有3个模型进行预测的部分。只要你有两个以上的预测,你就可以使用多数投票策略。

最新更新