自动从图像中提取文本



我在AWS S3 Bucket中有500个文件夹。在每个文件夹中,都有2到3个图像。如何在每个图像上应用Textract,并使用node-js提取完整的文本(所有文本连接(?我写了以下代码来获得S3对象:

const aws = require('aws-sdk');
const config = require('./config.js');
(async function(){
aws.config.setPromisesDependency();
try{
aws.config.update({
accessKeyId: config.accessKeyId,
secretAccessKey: config.secretAccessKey,
region: config.awsRegion
});
const s3 = new aws.S3();
const response = await s3.listObjectsV2({
Bucket : '<Bucket Name>',
Prefix : '<Prefix>'
}).promise();
console.log(response);
}
catch(e)
{
console.log('our err.',e);
}

})();

如何循环浏览其中的子文件夹和图像?

您可以:

  • 使用S3 API列出并循环浏览所有图像,对每个图像应用文本提取
  • 使用S3资源清册循环浏览所有图像并执行相同操作

对于新文件,您可以设置Lambda函数和S3PUT触发器,以自动将文本检测应用于新文件。

相关内容

  • 没有找到相关文章

最新更新