我必须从随机文本中识别国家名称。我有国家列表。
我正在努力寻找一个可以在国家列表上训练模型的解决方案,当我向该模型提供随机文本作为输入时,它将国家名称标识为输出。
如:-
- "我住在印度"; 将给予"印度">
- "伦敦是英国首都"will give "United Kingdom">
Thanks in advance.
在这种情况下,似乎您正在匹配文本。你为什么需要模特?似乎有点过头了。
如果你有国家列表,你应该规范文本
https://www.geeksforgeeks.org/normalizing-textual-data-with-python/然后你可以在文本中搜索国家。
https://www.dummies.com/programming/python/how-to-search-within-a-string-in-python/你可以使用某些技术来匹配,如levestein距离,但我认为没有必要为此建立一个模型。