令牌正则表达式规则可以在文档级别进行注释吗?



这就是问题所在。比方说,我有这个规则:

{
    pattern: ( [ner:/DATE|TIME/] ),
    action: ( Annotate($0, myNER, "MY_DATETIME" ) )
}

与其注释捕获组 $0,不如指定整个文档,如下所示:

{
    pattern: ( [ner:/DATE|TIME/] ),
    action: ( Annotate( <document>, myNER, "MY_DATETIME" ) )
}

这可能是一个非常有用的功能,允许在找到特定标记模式时注释整个文档(或句子(。谢谢。

目前还没有实现的方法可以做到这一点。 没有直接的方法可以通过TokensRegex访问代表文档的CoreMap。

每个令牌都需要有一个指向文档 CoreMap 的指针,然后您可以通过查看特定令牌来访问 TokensRegex 规则中的整个文档,但这需要对代码进行一些更改。

如果您想打开 GitHub 问题,我们可以尝试在将来的版本中添加此功能。

最新更新