斯坦福·科伦普(Stanford Corenlp)的返回不仅仅是基本关系三元组



corenlp返回的三元组超出了我们所期望的,即整个句子或短语,而不是构成句子传达的基本或基本信息的一个或两个三分之一。

例如,在句子中:

" Roy Coy MD在 16:00 CDT在2011年11月11日。"

我们期望这个三重:

preliminary diagnosis; be notify to; Dr. Tom

但是我们得到了这样的三元组:

1.0 diagnosis be notify by Roy Coy MD at 16:00 cdt on 11/11/2011
1.0 diagnosis be notify to Dr. Tom at 16:00 cdt on 11/11/2011
1.0 preliminary diagnosis be notify to Dr. Tom

除了基本信息外,还包含其他详细信息。在极端情况下,Corenlp返回整个原始句子。

为了将Corenlp输出减少到基本三元组,我们可以更改哪些论点?我们已经尝试了最大款项和三重严格集的数量,但它们不起作用。我们可以提供一个包含三联列表的文件。

Java代码:

java -mx1g -cp stanford-openie.jar;stanford-openie-models.jar;slf4j-api.jar edu.stanford.nlp.naturalli.OpenIE -openie.max_entailments_per_clause= 1 -openie.triple.strict= true -openie.splitter.disable=true

这实际上是设计。并不总是先验地清楚人们从Openie Systems中想要的粒度水平,因此我们的系统试图产生所有粒度。这里的预期用途是生产可以在数据库中查找的三元组。因此,如果有人问一个非常具体的查询,则返回更长的三元。如果有人问一个简单的查询,我们将返回简单的三元组(并且附带还有一些更长的三元格)。

最新更新