我需要我的聊天机器人向用户查询地址,因此我需要rasa NLU将消息中包含的地址组件(例如.zip代码、门牌号、街道名称等)作为实体返回。
当然,一种明显的方法是创建一个包含适当训练数据的训练文件。但由于这肯定是一个常见问题,我希望可能有另一种解决方案。此外,对我来说,在哪里可以获得各种格式的标记地址并不明显。
在这篇博文中,进行了一些评估,结果表明,如果添加足够的训练数据,实体提取器ner_crf地址的性能非常好。在博客文章中,地址注释如下:
Take me to [123 Washington Street](address) please
您可以通过提供一些正则表达式来支持识别 根据您是否有可能的街道名称列表,您还可以使用查找表