如何改装fasttext模型



我读过各种研究论文,认为可以对fasttext模型进行改造以提高其准确性(https://github.com/mfaruqui/retrofitting)。然而,我在如何实现它方面遇到了麻烦。

上面的github链接,将获取一个矢量文件并对其进行改造,输出另一个矢量。我可以使用gensim库加载它。然而,由于它是一个矢量文件,它不再是一个模型,也不会预测OOV(词汇表外(单词。这让它变得毫无意义。有没有办法以某种方式重新训练模型,使其具有更好的准确性?

据我所知,通过阅读论文和浏览存储库,所提出的方法只允许提高输入中给出的向量的质量(.vec(。

正如您在这里所读到的,fastText表示词汇表外单词的能力是.bin模型所固有的(它包含所有n-gram的向量(。

正如您可能也理解的那样,使用所提出的方法,没有现成的方法来改造fastText模型

最新更新