我想为斯坦福NER提供一些建议,我想知道检测新实体的最佳方法是什么:
- 使用RegexNer检测新实体?
- 用新实体训练自己的NER模型?
提前感谢。
如果您可以轻松地生成您想要标记的实体类型的大列表,我建议使用RegexNER。例如,如果您试图标记运动队,那么编译一个大的运动队名称列表并直接进行匹配可能会更容易。构建一个大型的训练集需要花费大量的精力。