如何使用GATE的众包插件将数据加载到CrowdFlower的工作中?



我试图在CrowdFlower上使用创建一个工作GATE众包插件。我的问题是我不能加载数据到根本就没有工作。到目前为止,我创建这个作业所做的是:

  1. 在PR中创建job builder .

  2. 右键单击作业构建器,选择创建一个新的CrowdFlower的工作。

  3. 用一些文档填充语料库,用一些文档进行预处理ANNIE的应用程序,例如:标记器和句子分配器

  4. 将作业构建器添加到语料库管道中,编辑一些参数它们与初始注释(标记和句子)匹配

  5. 运行管道。(当然我要确保Job ID匹配)

在我完成所有这些之后,作业仍然有0行数据。我想知道我做错了一些事情,因为我确信我遵循了本教程中的所有说明,特别是从28页到35页。对此有什么建议吗?

我打赌你在作业构建器运行时参数中有一个打字错误:)

仔细检查注释和注释集的名称,确保它们都存在于您的文档中。如果它们存在并且构建器找到了它们,则一个cf_…_id特征应该出现在每个实体注释上。

如果作业构建器发现任何注释,它将调用crowdflower API,并在上传数据失败时抛出异常。它听起来好像没有发送任何请求,我看到的唯一原因是它找不到注解。

最新更新