自动从图像中提取文本

我在AWS S3 Bucket中有500个文件夹。在每个文件夹中，都有2到3个图像。如何在每个图像上应用Textract，并使用node-js提取完整的文本(所有文本连接(？我写了以下代码来获得S3对象：

const aws = require('aws-sdk');
const config = require('./config.js');
(async function(){
aws.config.setPromisesDependency();
try{
aws.config.update({
accessKeyId: config.accessKeyId,
secretAccessKey: config.secretAccessKey,
region: config.awsRegion
});
const s3 = new aws.S3();
const response = await s3.listObjectsV2({
Bucket : '<Bucket Name>',
Prefix : '<Prefix>'
}).promise();
console.log(response);
}
catch(e)
{
console.log('our err.',e);
}

})();

如何循环浏览其中的子文件夹和图像？

您可以：

使用S3 API列出并循环浏览所有图像，对每个图像应用文本提取
使用S3资源清册循环浏览所有图像并执行相同操作

对于新文件，您可以设置Lambda函数和S3PUT触发器，以自动将文本检测应用于新文件。

相关内容

最新更新

热门标签：