是否有可能训练一个新的斯坦福NER模型,并将其与现有的模型相结合?



All,

这就是我希望做的——

目前,斯坦福NER可以识别人员,位置和组织。我想为这些类别添加更多详细信息 - 例如,我想确保可以识别更多的地点/人员/组织。所以我正在考虑训练我自己的模型,如此处所述。

这里给出了另一个关于训练自己的NER标记器的好教程。

现在,我的问题是,一旦我使用自己的训练数据创建一个新模型,是否有可能将这个新模型与现有的斯坦福模型结合起来?我想为现有模型添加额外的功能,我真的不想用我自己的模型完全替换它。

希望我把我的问题说清楚。非常感谢任何输入。

以下是有关训练ner的更多信息:

https://stanfordnlp.github.io/CoreNLP/ner.html

ner注释器将连续运行一系列序列标记器。

您可以使用ner.model参数进行设置。

例如,您可以将其设置为:

my_model.ser.gz,edu/stanford/nlp/models/ner/english.all.3class.distsim.crf.ser.gz,edu/stanford/nlp/models/ner/english.muc.7class.distsim.crf.ser.gz,edu/stanford/nlp/models/ner/english.conll.4class.distsim.crf.ser.gz

这将使您能够获得所有这些模型的结果......尽管没有办法将它们"组合"成一个模型。 它只会一个接一个地运行每个模型。 后续模型无法覆盖先前模型的标记决策。

您还可以编写规则,这些规则也将应用。 在不久的将来,我可能会花一些时间尝试更清楚地了解如何/更轻松地将您自己的自定义模型/规则与我们提供的基线集成。

最新更新