我尝试将单词聚类到同一类别中。因此,我想使用Spacy Word2Vec。 它已经可以使用香蕉苹果和汽车等简单的词。它显示了几乎相同的单词。
如果单词变得更具体,如汽车、电池、蓄电池、accu 等,如果更技术性,Spacy 会发送 Zero vectos。所以这些话没有被收录在书目中。
你对我有什么意见吗?
此外,我必须用德语做。
谢谢 约库勒马
文档说Word2Vec
需要一个模型来处理各种单词。
他们还给出了一个包含~100万个单词的模型示例,并展示了如何下载它:
python -m spacy download en_core_web_lg
请阅读此处的文档:https://spacy.io/usage/spacy-101#vectors-similarity
如果您需要不在所用模型中的单词的词向量,则必须:
查找并使用包含这些单词的其他模型
从您自己的训练数据中训练您自己的模型,其中包含这些单词在上下文中的用法的许多示例