这就是问题所在。比方说,我有这个规则:
{
pattern: ( [ner:/DATE|TIME/] ),
action: ( Annotate($0, myNER, "MY_DATETIME" ) )
}
与其注释捕获组 $0,不如指定整个文档,如下所示:
{
pattern: ( [ner:/DATE|TIME/] ),
action: ( Annotate( <document>, myNER, "MY_DATETIME" ) )
}
这可能是一个非常有用的功能,允许在找到特定标记模式时注释整个文档(或句子(。谢谢。
目前还没有实现的方法可以做到这一点。 没有直接的方法可以通过TokensRegex访问代表文档的CoreMap。
每个令牌都需要有一个指向文档 CoreMap 的指针,然后您可以通过查看特定令牌来访问 TokensRegex 规则中的整个文档,但这需要对代码进行一些更改。
如果您想打开 GitHub 问题,我们可以尝试在将来的版本中添加此功能。