是否有Azure平台服务可以转换pdf文件中的文本并将这些非结构化数据保存在数据库中



我们的组织正在将我们的日常工作迁移到Azure云平台上。我的一项工作是使用Python读取许多pdf文件,并将所有文本/非结构化数据转换为表格,例如。第一列显示文件名,第二列保存所有文本数据等。

只是想知道Azure平台中是否有一种服务可以自动实现这一点?我是Azure的新用户,所以对此不太熟悉。如果有帮助的话,非常感谢。

我建议查看Azure AI Document Intelligence(以前称为Azure Form Recognizer(。您可以训练它识别表格并从PDF文件中提取数据。

相关内容

最新更新