Google Cloud自然语言API可用于分析文本并返回一个语法解析树,其中每个单词都标有词性标记。
是否有一种方法来确定一个名词是否是复数?
如果Google Cloud NL能够找出引理,那么也许信息在那里,但没有通过API返回?
更新
随着NL API的GA启动,annotateText
端点现在为每个令牌返回一个number
键,指示单词是单数、复数还是双性。对于句子"There are some cats here",API为"cats"返回以下标记数据(注意number
是PLURAL
):
{
"text": {
"content": "cats",
"beginOffset": -1
},
"partOfSpeech": {
"tag": "NOUN",
"aspect": "ASPECT_UNKNOWN",
"case": "CASE_UNKNOWN",
"form": "FORM_UNKNOWN",
"gender": "GENDER_UNKNOWN",
"mood": "MOOD_UNKNOWN",
"number": "PLURAL",
"person": "PERSON_UNKNOWN",
"proper": "PROPER_UNKNOWN",
"reciprocity": "RECIPROCITY_UNKNOWN",
"tense": "TENSE_UNKNOWN",
"voice": "VOICE_UNKNOWN"
},
"dependencyEdge": {
"headTokenIndex": 1,
"label": "DOBJ"
},
"lemma": "cat"
}
感谢您试用NL API。
目前还没有一种干净的方法来检测复数,除了注意基词和引理不同,然后猜测它是否是复数(在英语中,它可能以-s结尾)。
然而,我们计划发布一种更好的方法来检测形态学信息,比如复数,所以请继续关注。