在我的项目中,我想计算文件夹的哈希。例如,有10个文件夹,这些文件夹有许多子文件。我知道很多获取文件哈希的方法,但有什么方法可以获取每个文件夹的哈希吗?
我这样做的目的是了解文件夹中的文件是否发生了更改。
我愿意接受建议和不同的想法,我需要你的帮助。提前谢谢。
这实际上取决于您希望修改检测的可靠性。最可靠的方法是遍历每个文件夹中的每个文件,并通过读取每个文件的每个字节来计算实际文件内容的哈希。
除此之外,您还可以检查文件元数据,如文件名、修改日期、文件大小。任何这些内容的变化都表明内容发生了变化。但是,其中任何一项都没有变化,这并不能最终表明文件内容没有变化。可以修改文件内容,保留相同的文件名,保持相同的文件大小,并手动将修改日期设置回原来的日期,这样就可以只检查元数据。
但是,如果你愿意接受它可能会被操纵愚弄,但通常会检测到更改,那么你可以迭代文件夹的所有文件,并计算一个使用元数据的组合哈希:文件名、文件大小和文件修改日期,并为文件夹生成一个哈希。根据你的目的,这可能不够,也可能不够——你必须打电话。
除此之外,您还必须读取每个文件的每个字节,并计算实际文件内容的哈希值。
以下是元数据哈希算法的一些演示代码:
const fsp = require("fs/promises");
const { createHash } = require("crypto");
const path = require('path');
// -----------------------------------------------------
// Returns a buffer with a computed hash of all file's metadata:
// full path, modification time and filesize
// If you pass inputHash, it must be a Hash object from the crypto library
// and you must then call .digest() on it yourself when you're done
// If you don't pass inputHash, then one will be created automatically
// and the digest will be returned to you in a Buffer object
// -----------------------------------------------------
async function computeMetaHash(folder, inputHash = null) {
const hash = inputHash ? inputHash : createHash('sha256');
const info = await fsp.readdir(folder, { withFileTypes: true });
// construct a string from the modification date, the filename and the filesize
for (let item of info) {
const fullPath = path.join(folder, item.name);
if (item.isFile()) {
const statInfo = await fsp.stat(fullPath);
// compute hash string name:size:mtime
const fileInfo = `${fullPath}:${statInfo.size}:${statInfo.mtimeMs}`;
hash.update(fileInfo);
} else if (item.isDirectory()) {
// recursively walk sub-folders
await computeMetaHash(fullPath, hash);
}
}
// if not being called recursively, get the digest and return it as the hash result
if (!inputHash) {
return hash.digest();
}
}
computeMetaHash(__dirname).then(result => {
console.log(result);
}).catch(err => {
console.log(err);
});
基于@jfriend00的实现(谢谢!(,该解决方案接受多个路径,并且基于TypeScript:
import { Hash, createHash } from "node:crypto";
import { readdirSync, statSync } from "node:fs";
import { join } from "node:path";
/**
* Creates hash of given files/folders. Used to conditionally deploy custom
* resources depending if source files have changed
*/
export function computeMetaHash(paths: string[], inputHash?: Hash) {
const hash = inputHash ? inputHash : createHash("sha1");
for (const path of paths) {
const statInfo = statSync(path);
if (statInfo.isDirectory()) {
const directoryEntries = readdirSync(path, { withFileTypes: true });
const fullPaths = directoryEntries.map((e) => join(path, e.name));
// recursively walk sub-folders
computeMetaHash(fullPaths, hash);
} else {
const statInfo = statSync(path);
// compute hash string name:size:mtime
const fileInfo = `${path}:${statInfo.size}:${statInfo.mtimeMs}`;
hash.update(fileInfo);
}
}
// if not being called recursively, get the digest and return it as the hash result
if (!inputHash) {
return hash.digest().toString("base64");
}
return;
}