如何在crf++中将地名词典或字典表示为特性



如何使用地名词典或字典作为crf++的功能?

详细说明:假设我想对人名做NER,并且我有一个包含常见人名的地名表(或字典),我想使用这个地名表作为crf++的输入,我怎么能做到这一点?

我使用条件随机字段包crf++来执行命名实体识别任务。我知道如何在crf++中表示一些常用的特性。例如,如果我们想使用大写作为一个特征,我们可以在crf的特征模板中添加一个单独的列,指示一个单词是否大写。

您可以创建一个新特性来指示一个标记是否在字典/地名表中。只需检查set membership并将Gazeteer功能设置为1或0。

最新更新