如何找到复数与谷歌云自然语言API



Google Cloud自然语言API可用于分析文本并返回一个语法解析树,其中每个单词都标有词性标记。

是否有一种方法来确定一个名词是否是复数?

如果Google Cloud NL能够找出引理,那么也许信息在那里,但没有通过API返回?

更新

随着NL API的GA启动,annotateText端点现在为每个令牌返回一个number键,指示单词是单数、复数还是双性。对于句子"There are some cats here",API为"cats"返回以下标记数据(注意numberPLURAL):

{
      "text": {
        "content": "cats",
        "beginOffset": -1
      },
      "partOfSpeech": {
        "tag": "NOUN",
        "aspect": "ASPECT_UNKNOWN",
        "case": "CASE_UNKNOWN",
        "form": "FORM_UNKNOWN",
        "gender": "GENDER_UNKNOWN",
        "mood": "MOOD_UNKNOWN",
        "number": "PLURAL",
        "person": "PERSON_UNKNOWN",
        "proper": "PROPER_UNKNOWN",
        "reciprocity": "RECIPROCITY_UNKNOWN",
        "tense": "TENSE_UNKNOWN",
        "voice": "VOICE_UNKNOWN"
      },
      "dependencyEdge": {
        "headTokenIndex": 1,
        "label": "DOBJ"
      },
      "lemma": "cat"
}

感谢您试用NL API。

目前还没有一种干净的方法来检测复数,除了注意基词和引理不同,然后猜测它是否是复数(在英语中,它可能以-s结尾)。

然而,我们计划发布一种更好的方法来检测形态学信息,比如复数,所以请继续关注。

相关内容

  • 没有找到相关文章

最新更新