发现不同单词之间的语义相似性和关系



我正在进行一个项目,该项目涉及计算不同概念之间的相关性。

示例:"着陆"-与"到达;到来"one_answers"着陆"相关,"电话"-与"电子;电力"one_answers"通话;通信"相关,"电影"-与"移动;更改"one_answers"图片;图像"相关,等等。

我已经检查了WordNet框架和WordNet::Similarity Perl模块,但在某些情况下它们不可用,尤其是在我需要将名词与动词连接的情况下(例如,名词"dog"和动词"to bark")。此外,WordNet以层次结构(例如:计算机->机器->设备->仪器)组织所有的synset,这并不是我在项目中真正需要的(当然,我可能错了)。

问题是,我应该使用哪个框架或数据库来解决问题?我从哪里开始?

如果你能给我一些建议,那将是非常有帮助的。

word2vec嵌入可能会很好地完成您的任务。它给出了一个比wordnet更温和的相似性概念。你可以从这里链接一些预先训练好的嵌入https://code.google.com/p/word2vec/。

最新更新