NLP -特定文本提取



我必须从随机文本中识别国家名称。我有国家列表。

我正在努力寻找一个可以在国家列表上训练模型的解决方案,当我向该模型提供随机文本作为输入时,它将国家名称标识为输出。

如:-

  • "我住在印度";
  • 将给予"印度">
  • "伦敦是英国首都"will give "United Kingdom">

Thanks in advance.

在这种情况下,似乎您正在匹配文本。你为什么需要模特?似乎有点过头了。

如果你有国家列表,你应该规范文本

https://www.geeksforgeeks.org/normalizing-textual-data-with-python/

然后你可以在文本中搜索国家。

https://www.dummies.com/programming/python/how-to-search-within-a-string-in-python/

你可以使用某些技术来匹配,如levestein距离,但我认为没有必要为此建立一个模型。

相关内容

  • 没有找到相关文章

最新更新