我想知道Java中是否有一个API可以定义单词并找到单词的起源。我记得不久前搜索这个并看到"apache commons",但我不确定。
所以基本上,用户将能够输入一个单词"溢出",然后程序将能够定义这个词。所以我正在寻找一个可以定义单词并找到单词起源的 API。因此,"recherche"一词的起源是"法语"。
WordNet会给你一半的内容:你可以查找一个单词的定义。 请注意,WordNet for Java有几个实现:jwi,jaws,Dan Bikel's,WordnetAPI。 其中一些可能比 miku 建议的 jwordnet 更容易用于您的目的(我只使用了 jaws 和 jwi)。
注意:WordNet不会给你来源(AFAIK)。 我不知道有哪个软件可以做到。
注意:您必须提供单词的引理才能在字典中查找它。 这意味着,如果要在自由文本文档(可以包含屈折形式)上自动执行此操作,则必须应用一些自然语言处理 (NLP) 技术。 如果你走这条路,我会建议GATE项目的Morph插件。
Wordnet?它有一个Java包装器:http://sourceforge.net/projects/jwordnet/
NLP工具包的另一个列表:
- http://en.wikipedia.org/wiki/List_of_natural_language_processing_toolkits
要检测语言:
- http://www.jroller.com/melix/entry/nlp_in_java_a_language
有一个词源网站:http://www.etymonline.com/
它给出的结果是:研究1722年,出自神父"小心翼翼地寻找",出自"小心翼翼地寻找"。常用19c.的食物,风格等,表示晦涩的卓越。
不知道他们是否得到了API,但使用某种脚本来查询它。
因此,在上面的句子中找到一种检测"Fr."的好方法。
干杯埃里克
你找过JWKTL吗?
"维基词典是一个多语言的,基于网络的,免费提供的词典, 词库和短语书,旨在作为词汇伴侣 维基百科。最近,它被认为是一个有前途的词汇 自然语言处理应用程序的语义资源。
使用它,您可以看到单词的词源。