Node.js:你何时知道一组异步任务何时完成



我想下降一个目录,并根据正则表达式检查我在那里看到的每个文件的名称。基本上,通用unix find命令的一个版本,仅用Node.js编写。我不关心文件的顺序,但我确实想确保我得到了所有的文件。

我有下面的代码,这是接近(我认为)我想要的。它接受一个startdir、一个regexp和一个回调;对于它分析的每个文件,它将sentinel的值增加1,并在完成分析后减少哨兵。我担心的是,如果有一个文件和一个深度嵌套的目录集合,它将在找到第二个文件之前很久分析该文件并触发回调,并且可能会调用回调两次。

显然,我可以通过使用fired变量来限制它第二次触发来防止回调被调用两次。但这仍然会给我错误的数据。我在这里做错了什么,是否有更适合节点的方法来做到这一点?

fs = require('fs')
path = require('path')
function get_all_files(startdir, regexp, callback) {
    var sentinel = 0;
    var results = [];
    function check_sentinel() {
        sentinel--;
        if (sentinel === 0) {
            callback(results);
        }
    }
    function check_file(dir, filename) {
        var fname;
        sentinel++;
        if (regexp.test(filename)) {
            results.push(path.join(dir, filename));
        }
        check_sentinel();
    }
    function check_directory(dir) {
        fs.readdir(path.join(this.rootpath, dirpath), function(err, files) {
            var fname, i, len, npath;
            if (err) {
                throw err
            }
            for (i = 0, len = files.length; i < len; i++) {
                fname = files[i];
                npath = path.join(dir, fname);
                fs.stat(npath, function(err, stats) {
                    if (stats.isFile()) {
                        check_file(dir, fname);
                    } else {
                        if (stats.isDirectory()) {
                            check_directory(npath);
                        }
                    }
                });
            }
        });
    }
    check_directory(startdir);
}

几点思考…

我从来没有使用过它,但是做你所要求的最简单的方法可能是使用async.js walkfiles函数。查看此处的示例测试。

否则,我会考虑构建一个函数调用数组,并从递归目录遍历函数返回该数组(而不是使用哨兵等)。换句话说,check_directory返回与您正在查找的文件匹配的函数调用数组。如果没有文件,则数组为空。

最后,结合递归顶部的数组,并使用async库(与async.js不同)使用并行函数一次性执行所有函数数组(参见本线程中使用"series"的示例)。

最新更新