我已经搜索了一段时间,但没有找到预训练的NerDL(tensorflow(模型中包含的NER标签。我认为培训数据可以提供这样的信息,但我看不到任何文件中提到这一点。
可下载型号:https://s3.amazonaws.com/auxdata.johnsnowlabs.com/public/models/ner_precise_en_1.7.0_2_1539623388047.zip
任何方向都将不胜感激!
更新:
根据这里的建议,我确实在SparkNLP github中提交了一个问题:(我刚收到他们的回复。答案是:
出于实际目的,预训练的NER模型具有
B-ORG
I-ORG
B-PER
I-PER
B-LOC
I-LOC
它是从以下方面进行培训的:https://raw.githubusercontent.com/patverga/torch-ner-nlp-from-scratch/master/data/conll2003/eng.train
请参阅此处的原始问题。
该模型是在CONLL2003数据集上为NER、训练的
http://aclweb.org/anthology/W03-0419
该数据集基本上有PERSON、Organisation和LOCATION。
希望这能有所帮助,阿尔贝托。