使用手套中的培训数据将数据集嵌入单词嵌入



我最近在我的Mac中安装了Gensim并手套,并试图获取有关我拥有的文本数据的单词嵌入。但是,我很难找到合适的功能。我只遇到了在两个单词之间获得相似指标的方法。如何使用库中存在的数据训练手套对象并使用它在数据集中获取单词的嵌入式?还是Python中还有其他图书馆可以这样做?谢谢!

实际上,手套的格式与Word2Vec不同,您可以使用此https://radimreareurek.com/gensim/scripts/gloves/gloves/gloves/glove2word2words.html

让转换后的手套是glove_changed.txt

import gensim model = gensim.models.KeyedVectors.load_word2vec_format('glove_changed.txt', binary=False) print(model['cat']) // This will give the wordvector for the word 'cat'

最新更新