在javascript中将pdf文本项存储到数组中



我在其他地方读过(使用javascript阅读PDF文件)如何阅读PDF文件中的文本,并在控制台上显示它们。这是使用以下代码完成的:

var PdfReader = require("pdfreader").PdfReader;
new PdfReader().parseFileItems("sample.pdf", function(err, item){
if (item && item.text)
console.log(item.text);
});

我的问题是,而不是使用console.log在控制台中显示文本,我如何将它们存储在数组中,以便在脚本的后期阶段使用?

初始化parse函数上方的数组,然后将项压入数组:

var PdfReader = require("pdfreader").PdfReader;
var arr = [];
new PdfReader().parseFileItems("sample.pdf", function(err, item){
if (item && item.text){
arr.push(item.text);
}
});
console.log(arr);
const { PdfReader } = require("pdfreader");
var arr = [];
new PdfReader().parseFileItems("test/sample.pdf", (err, item) => {
if (err) console.error("error:", err);
else if (!item) console.log(arr);
else if (item.text) arr.push(item.text);
});

我修改了官方示例中的代码:https://github.com/adrienjoly/npm-pdfreader#raw-pdf-reading

最新更新