我有一个NLP任务,我需要确保多个句子的段落至少包含一个结构良好的问题,我使用OpenNLP来生成段落中的解析树。我的问题是:
1-是否有一种方法可以为一个结构正确的问题获得可能的解析树列表。
2-如何比较两个解析树
谢谢
你自己已经回答了这个问题。你只需要得到包含不同类型问题的数据集,然后使用它。
-
获取不同类型的问题并解析相应的树。获取所有输出解析树的格式,以便您可以在下一步中使用它。
-
当涉及到比较解析树时,它基本上是比较文本。这是一个相当简单的任务。
但是很明显,如果你直接处理文本文件,这样做会花费更长的时间和内存。为此,将标准问题的解析树转换并保存为二进制,这将在与下一步连接时花费更少的时间和内存。
希望这对你有帮助,一切顺利!