All,
这就是我希望做的——
目前,斯坦福NER可以识别人员,位置和组织。我想为这些类别添加更多详细信息 - 例如,我想确保可以识别更多的地点/人员/组织。所以我正在考虑训练我自己的模型,如此处所述。
这里给出了另一个关于训练自己的NER标记器的好教程。
现在,我的问题是,一旦我使用自己的训练数据创建一个新模型,是否有可能将这个新模型与现有的斯坦福模型结合起来?我想为现有模型添加额外的功能,我真的不想用我自己的模型完全替换它。
希望我把我的问题说清楚。非常感谢任何输入。
以下是有关训练ner
的更多信息:
https://stanfordnlp.github.io/CoreNLP/ner.html
ner
注释器将连续运行一系列序列标记器。
您可以使用ner.model
参数进行设置。
例如,您可以将其设置为:
my_model.ser.gz,edu/stanford/nlp/models/ner/english.all.3class.distsim.crf.ser.gz,edu/stanford/nlp/models/ner/english.muc.7class.distsim.crf.ser.gz,edu/stanford/nlp/models/ner/english.conll.4class.distsim.crf.ser.gz
这将使您能够获得所有这些模型的结果......尽管没有办法将它们"组合"成一个模型。 它只会一个接一个地运行每个模型。 后续模型无法覆盖先前模型的标记决策。
您还可以编写规则,这些规则也将应用。 在不久的将来,我可能会花一些时间尝试更清楚地了解如何/更轻松地将您自己的自定义模型/规则与我们提供的基线集成。