我正在尝试将我的模型与fasttext unsupervised.py
对齐https://github.com/facebookresearch/MUSE.我用fasttext
训练了我的模型,得到了二进制文件model.bin
。当我使用无人监管.py时,我会得到
error: ValueError: model.bin has wrong file format
怎么了?我必须有一个.vec
文件吗?如何获取?
有关.bin和.vec文件之间差异的信息,您可以阅读此问题。
在任何情况下,MUSE都需要.vc文件。
如果您想将.bin文件转换为.vc文件,这个答案可能会对您有所帮助
Puthon Gensim软件包可以通过其FastText.load_facebook_model()
方法加载Facebook FastText.bin
模型:
ft_model = FastText.load_facebook_model(path_to_bin)
然后,使用KeyedVectors' method
.save_word2vec_format((with the
binary=False`选项:将模型包含的.wv
单词矢量中的矢量仅保存为纯文本.vec
文件
ft_model.wv.save_word2vec_format('ft_model.vec')