我正在尝试使用express和busboy在Node.js4.x中实现文件上传。我已经能够上传文件并将其存储在Azure Blob存储中。
不,在将文件存储到Azure之前,我想验证文件类型,并拒绝任何无效的文件。
我想用幻数进行验证。我发现const fileType = require('file-type');
,它为我确定文件类型。
现在我正在努力让这项工作尽可能高效,但我正在努力:我想直接将文件流管道传输到azure。但在此之前,我需要将流中的前5个字节读取到按文件类型处理的缓冲区中。
从溪流中阅读,然后滚落到蔚蓝中,肯定是行不通的。经过一番研究,我找到了一个解决方案,将文件分为两个PassThrough流。但现在我正在努力正确处理这两个流。
const fileType = require('file-type');
const pass = require('stream').PassThrough;
//...
req.busboy.on('file', function (fieldname, file, filename) {
console.log("Uploading: " + filename);
var b = new pass;
var c = new pass;
file.pipe(b);
file.pipe(c);
var type = null;
b.on('readable', function() {
b.pause();
if(type === null) {
var chunk = b.read(5);
type = fileType(chunk) || false;
b.end();
}
});
b.on('finish', function() {
if(type && ['jpg', 'png', 'gif'].indexOf(type.ext) !== -1) {
var blobStream = blobSvc.createWriteStreamToBlockBlob(storageName,
blobName,
function (error) {
if (error) console.log('blob upload error', error);
else console.log('blob upload complete')
});
c.pipe(blobStream);
}
else {
console.error("Rejected file of type " + type);
}
});
});
这种解决方案有时有效,有时还会出现一些"结束后写入"错误。此外,我认为流没有正确关闭,因为通常情况下,在请求之后,express会在控制台上记录这样的内容:
POST /path - - ms - -
但是,这个日志消息现在在"blob上传完成"后大约是30s-60秒,可能是由于一些超时。
知道怎么解决这个问题吗?
您不需要在混合中添加额外的流。仅unshift()
将消耗的部分返回到流上。例如:
const fileType = require('file-type');
req.busboy.on('file', function (fieldname, file, filename) {
function readFirstBytes() {
var chunk = file.read(5);
if (!chunk)
return file.once('readable', readFirstBytes);
var type = fileType(chunk);
if (type.ext === 'jpg' || type.ext === 'png' || type.ext === 'gif') {
const blobStream = blobSvc.createWriteStreamToBlockBlob(
storageName,
blobName,
function (error) {
if (error)
console.log('blob upload error', error);
else
console.log('blob upload complete');
}
);
file.unshift(chunk);
file.pipe(blobStream);
} else {
console.error('Rejected file of type ' + type);
file.resume(); // Drain file stream to continue processing form
}
}
readFirstBytes();
});