使用 NLTK 和 Python 从自由文本中提取关键字/短语以进行结构化查询



我想从自由文本中解释特定的关键字,例如"我想从最近的餐馆订购煮鸡蛋和菠菜汤",并使用它们从我的数据库中搜索内容。例如,我想提取以下特定关键字,并希望输出类似于以下内容的输出,例如(关键字类型,关键字值)的元组。例如("食品","煮鸡蛋"),("食品","菠菜汤"),("位置","最近的餐厅")等。

需要使用这些值和类型来进一步细化和查询数据库中的表。

我努力使用使用python和NLTK的各种技术找到答案,但需要帮助来指出正确的方向。我是否使用了正确的技术/框架?在这里需要帮助

谢谢萨米

这并不难,但也不是那么精确。

使用 NLTK 的 PoS 标记,然后提取nounscompound nouns,并在数据库查询中使用它们。

自然句实际上有两个部分,一个动作,即动词,和一个名词,即宾语。

因此,"我想从最近的餐馆订购煮鸡蛋和菠菜汤"告诉我们:

  • 动作/动词order
  • 宾语/名词boiled eggsspinach soup
  • 位置nearest restaurants

最新更新