Senserelate 目标词:为最终用户提供"best"替代方案



我的问题简介:用户可以搜索术语,RitaWordNet提供了一个名为getSenseIds((的方法来获取相关的含义。到目前为止,我正在使用WS4J(WordNet Similarity for Java,http://code.google.com/p/ws4j/)它有不同的算法来定义距离。搜索"用户"会得到这样的结果:

  • 用户
  • 剥削者
  • 吸毒者

http://wordnetweb.princeton.edu/perl/webwn?s=user&sub=搜索+WordNet&o2=&o0=1&o8=1&o1=1&o7=&o5=&o9=&o6=&o3=&o4=&h=0

Lin距离是通过比较WS4J中的两个术语来测量的(我假设是targetWord?(:

  • 用户和用户之间的相似性=1.7976931348623157E308
  • 用户和剥削者之间的相似性=0.1976958835785797

我想向最终用户返回一个建议,即"用户"的感觉是最相关/最正确的答案,但问题是这取决于句子的其余部分。

例如:"老人是公共交通的常客","年轻人在学习NLP时变成了吸毒者。"。

我认为senserelate项目中包含了我所缺少的内容。在我搜索的过程中也发现了这个帖子:单词消歧算法

希望有人能回答我的问题:(

您可能想尝试WordNet::SenseRelate::AllWords-有一个在线演示http://maraca.d.umn.edu

最新更新