我正在尝试在自定义数据上训练AllenNLP,而不是使用预先训练的模型来进行共引用解析。说明在这里,但它们非常模糊,我不确定如何进行,特别是我不知道如何修改JSONNET文件,以指示我的训练、测试和开发ConLL-2012训练文件的路径。以前有人做到过这一点吗?非常感谢。
您可以在jsonnet-config:中的这些行中指定数据的路径
"train_data_path": std.extVar("COREF_TRAIN_DATA_PATH"),
"validation_data_path": std.extVar("COREF_DEV_DATA_PATH"),
"test_data_path": std.extVar("COREF_TEST_DATA_PATH"),
您可以更新配置以显式使用路径,也可以在使用allennlp train
命令运行配置之前设置这些环境变量。