使用 Java 定义单词



我想知道Java中是否有一个API可以定义单词并找到单词的起源。我记得不久前搜索这个并看到"apache commons",但我不确定。

所以基本上,用户将能够输入一个单词"溢出",然后程序将能够定义这个词。所以我正在寻找一个可以定义单词并找到单词起源的 API。因此,"recherche"一词的起源是"法语"。

WordNet会给你一半的内容:你可以查找一个单词的定义。 请注意,WordNet for Java有几个实现:jwi,jaws,Dan Bikel's,WordnetAPI。 其中一些可能比 miku 建议的 jwordnet 更容易用于您的目的(我只使用了 jawsjwi)。

注意:WordNet不会给你来源(AFAIK)。 我不知道有哪个软件可以做到。

注意:您必须提供单词的引理才能在字典中查找它。 这意味着,如果要在自由文本文档(可以包含屈折形式)上自动执行此操作,则必须应用一些自然语言处理 (NLP) 技术。 如果你走这条路,我会建议GATE项目的Morph插件。

也许是

Wordnet?它有一个Java包装器:http://sourceforge.net/projects/jwordnet/

NLP工具包的另一个列表:

  • http://en.wikipedia.org/wiki/List_of_natural_language_processing_toolkits

要检测语言:

  • http://www.jroller.com/melix/entry/nlp_in_java_a_language

有一个词源网站:http://www.etymonline.com/

它给出的结果是:研究1722年,出自神父"小心翼翼地寻找",出自"小心翼翼地寻找"。常用19c.的食物,风格等,表示晦涩的卓越。

不知道他们是否得到了API,但使用某种脚本来查询它。

因此,在上面的句子中找到一种检测"Fr."的好方法。

干杯埃里克

你找过JWKTL吗?

"维基词典是一个多语言的,基于网络的,免费提供的词典, 词库和短语书,旨在作为词汇伴侣 维基百科。最近,它被认为是一个有前途的词汇 自然语言处理应用程序的语义资源。

使用它,您可以看到单词的词源。

相关内容

  • 没有找到相关文章

最新更新