我想下降一个目录,并根据正则表达式检查我在那里看到的每个文件的名称。基本上,通用unix find
命令的一个版本,仅用Node.js编写。我不关心文件的顺序,但我确实想确保我得到了所有的文件。
我有下面的代码,这是接近(我认为)我想要的。它接受一个startdir、一个regexp和一个回调;对于它分析的每个文件,它将sentinel
的值增加1,并在完成分析后减少哨兵。我担心的是,如果有一个文件和一个深度嵌套的目录集合,它将在找到第二个文件之前很久分析该文件并触发回调,并且可能会调用回调两次。
显然,我可以通过使用fired
变量来限制它第二次触发来防止回调被调用两次。但这仍然会给我错误的数据。我在这里做错了什么,是否有更适合节点的方法来做到这一点?
fs = require('fs')
path = require('path')
function get_all_files(startdir, regexp, callback) {
var sentinel = 0;
var results = [];
function check_sentinel() {
sentinel--;
if (sentinel === 0) {
callback(results);
}
}
function check_file(dir, filename) {
var fname;
sentinel++;
if (regexp.test(filename)) {
results.push(path.join(dir, filename));
}
check_sentinel();
}
function check_directory(dir) {
fs.readdir(path.join(this.rootpath, dirpath), function(err, files) {
var fname, i, len, npath;
if (err) {
throw err
}
for (i = 0, len = files.length; i < len; i++) {
fname = files[i];
npath = path.join(dir, fname);
fs.stat(npath, function(err, stats) {
if (stats.isFile()) {
check_file(dir, fname);
} else {
if (stats.isDirectory()) {
check_directory(npath);
}
}
});
}
});
}
check_directory(startdir);
}
几点思考…
我从来没有使用过它,但是做你所要求的最简单的方法可能是使用async.js walkfiles函数。查看此处的示例测试。
否则,我会考虑构建一个函数调用数组,并从递归目录遍历函数返回该数组(而不是使用哨兵等)。换句话说,check_directory返回与您正在查找的文件匹配的函数调用数组。如果没有文件,则数组为空。
最后,结合递归顶部的数组,并使用async库(与async.js不同)使用并行函数一次性执行所有函数数组(参见本线程中使用"series"的示例)。