如何使用 git shortlog 在单个目录中聚合多个存储库的用户提交统计信息?



我有一个目录,里面有很多 Git repo 子目录,我想积累类似于

git shortlog -sne --no-merges

对于其中的所有存储库,按用户的所有提交总数对用户进行排序。

例如,对于回购 1:

430 Author 1 <author1@email.com>
20 Author 2 <author2@email.com>

例如,对于回购 2:

123 Author 1 <author1@email.com>
92 Author 2 <author2@email.com>

总结果:

453 Author 1 <author1@email.com>
112 Author 2 <author2@email.com>

是否可以使用 git 内置工具做到这一点?

我能够走出存储库文件夹并为单个文件夹运行它:

git -C repoFolder shortlog -sne --no-merges

循环cd到每个子目录,并使用awk处理git shortlog输出:

for d in *; do git -C $d shortlog -ens --no-merges; done |
awk '{name_email=""; for (i=2; i<=NF; i++) {name_email=name_email " " $i}; count_by_user[name_email]+=$1} END {for (name_email in count_by_user) print count_by_user[name_email], name_email}'

awk脚本解释道:

name_email="";

对于每个输入行:从空变量name_email开头。

for (i=2; i<=NF; i++) {name_email=name_email " " $i};

将 2 个空格分隔的所有字段连接成name_email. 即合并所有名称+电子邮件字段。

count_by_user[name_email]+=$1

创建一个新的关联数组count_by_user并在每一行中按第一个字段的值(提交计数(增加值(默认值为 0(。

END {for (name_email in count_by_user) print count_by_user[name_email], name_email}

最后打印结果:运行count_by_user索引(名称+电子邮件(,打印计算计数器,打印姓名+电子邮件。结果打印时未排序。可以在非常awk的脚本中排序或使用| sort -nr进行后处理。

使用gawk版本的awk开发。

最新更新