如何在NLP中找到相似的名词短语



有没有一种方法可以识别类似的名词短语。一些人建议使用基于模式的方法,例如X as Y表达式:

Usain Bolt饰演Sprint King

利物浦作为红军

有许多技术可以为给定实体找到替代名称,使用模式,例如:

  • X also known as Y
  • X also titled as Y

扫描大量文档(如维基百科或新闻报纸文章(是一种方法。

还有其他选择,我记得是使用维基百科的链接结构,例如,通过探索文章之间的重定向链接。您可以从这里下载一个包含重定向列表的文件:https://wiki.dbpedia.org/Downloads2015-04通过浏览文件,您可以找到实体的替代名称/同义词,例如:

  • Kennedy_Centre -> John_F._Kennedy_Center_for_the_Performing_Arts>
  • Lord_Alton_of_Liverpool -> David_Alton,_Baron_Alton_of_Liverpool
  • Indiana_jones_2 -> Indiana_Jones_and_the_Temple_of_Doom

您可以做的另一件事是将这两种技术结合起来,例如,查找Indiana JonesIndiana_Jones_and_the_Temple_of_Doom都出现并且相距不超过4或5个标记的文本段。您可能会找到类似also titled as的模式,然后可以使用这些模式来查找更多同义词/替代名称。

相关内容

  • 没有找到相关文章

最新更新