上传PDF文件并通过Textract进行分析,无需上传S3 Bucket中的文件



Im计划从laravel创建一个程序,在其中您可以上传pdf文件并使用Textract OCR进行分析。我希望用户上传pdf文件并使用textract进行分析,而无需上传S3桶中的pdf。我的问题是,这可能吗?或者我真的需要先上传到s3 bucket中,然后才能通过textract进行分析?。因为我在互联网上看到的大多数教程的pdf文件都在s3 bucket中。

感谢

PDF文件必须上传到S3存储桶中。这并不意味着它必须永远存在。例如,您可以在bucket上添加一个生命周期规则,作为在1天后删除所有文件的保护措施,以防在处理后删除文件时遇到问题。

顺便说一下,流程是异步的:

  • 将文件上传到S3
  • 调用Textract API请求对S3对象进行分析,并提供一个将发布结果的SNS主题
  • 当结果发布到队列中时,您可以通过轮询来获取消息,但最好的解决方案是为接收消息时调用的主题订阅lambda。然后,lambda可以处理JSON响应,根据需要存储信息,并删除S3存储桶中的对象

最新更新