单词与空间,单词进入相同的分类



我尝试将单词聚类到同一类别中。因此,我想使用Spacy Word2Vec。 它已经可以使用香蕉苹果和汽车等简单的词。它显示了几乎相同的单词。

如果单词变得更具体,如汽车、电池、蓄电池、accu 等,如果更技术性,Spacy 会发送 Zero vectos。所以这些话没有被收录在书目中。

你对我有什么意见吗?

此外,我必须用德语做。

谢谢 约库勒马

文档说Word2Vec需要一个模型来处理各种单词。

他们还给出了一个包含~100万个单词的模型示例,并展示了如何下载它:

python -m spacy download en_core_web_lg

请阅读此处的文档:https://spacy.io/usage/spacy-101#vectors-similarity

如果您需要不在所用模型中的单词的词向量,则必须:

  • 查找并使用包含这些单词的其他模型

  • 从您自己的训练
  • 数据中训练您自己的模型,其中包含这些单词在上下文中的用法的许多示例

最新更新