如何从bin文件中获取vec文件



我正在尝试将我的模型与fasttext unsupervised.py对齐https://github.com/facebookresearch/MUSE.我用fasttext训练了我的模型,得到了二进制文件model.bin。当我使用无人监管.py时,我会得到

error: ValueError: model.bin has wrong file format

怎么了?我必须有一个.vec文件吗?如何获取?

有关.bin和.vec文件之间差异的信息,您可以阅读此问题。

在任何情况下,MUSE都需要.vc文件

如果您想将.bin文件转换为.vc文件,这个答案可能会对您有所帮助

Puthon Gensim软件包可以通过其FastText.load_facebook_model()方法加载Facebook FastText.bin模型:

ft_model = FastText.load_facebook_model(path_to_bin)

然后,使用KeyedVectors' method.save_word2vec_format((with thebinary=False`选项:将模型包含的.wv单词矢量中的矢量仅保存为纯文本.vec文件

ft_model.wv.save_word2vec_format('ft_model.vec')

最新更新