用Regexner而不是CRF模型命名为实体

我试图在任务中使用Stanford Corenlp检测命名实体。

我已经给出了我的Regexner映射文件中的规则，如下所示：

Train   VEHICLE_TYPE    2.0

但它识别为Train为CRIMINAL_CHARGE实体类型。

我添加了此选项ner.applyFineGrained并将其设置为true，也许这就是为什么它使用Corenlp的CRF模型覆盖的原因。

我的问题是如何在Regexner映射文件中添加此类例外或有更好的方法。

您应该使用以下设置：

# run fine-grained NER with a custom rules file
java -Xmx4g -cp "*" edu.stanford.nlp.pipeline.StanfordCoreNLP -annotators tokenize,ssplit,pos,lemma,ner -ner.fine.regexner.mapping custom.rules -file example.txt -outputFormat text

您需要确保将ner.fine.regexner.mapping设置为自定义规则文件，而不是默认的细粒规则，该规则将标记诸如CRIMINAL_CHARGE

之类的内容。

相关内容

最新更新

热门标签：