如何训练新的OpenIE模型?



我使用stanford-corenlp-4.2.0从非结构化文本中提取数据。看起来OpenIE是有帮助的,但应该针对我的具体情况进行改进。有可能训练一个新的开放模式吗?如何训练?由于

这是一个相当宽泛的问题。有很多方法可以构建一个新的OpenIE模型。

你正在尝试建立一个基于规则的模型吗?深度学习模型?两者的结合?斯坦福CoreNLP的OpenIE注释器有哪些方面是你想要改进的?

没有你的领域知识水平、深度学习技能等,很难回答这个问题。我建议您首先回顾一下关于公开信息提取的调查,比如这个:https://arxiv.org/abs/1806.05599,然后决定一个架构。

然后,你可以建立自己的补充训练集,或者一个适合你需要的数据集,它可以用来训练一个已经存在的体系结构。当然,您也可以自由地修改体系结构。如果您觉得基于规则的模型就足够了,您可以编辑适当的代码,或者对来自基于规则的模型的结果进行后处理。

最新更新