我有一个目录,里面有很多 Git repo 子目录,我想积累类似于
git shortlog -sne --no-merges
对于其中的所有存储库,按用户的所有提交总数对用户进行排序。
例如,对于回购 1:
430 Author 1 <author1@email.com>
20 Author 2 <author2@email.com>
例如,对于回购 2:
123 Author 1 <author1@email.com>
92 Author 2 <author2@email.com>
总结果:
453 Author 1 <author1@email.com>
112 Author 2 <author2@email.com>
是否可以使用 git 内置工具做到这一点?
我能够走出存储库文件夹并为单个文件夹运行它:
git -C repoFolder shortlog -sne --no-merges
循环cd
到每个子目录,并使用awk
处理git shortlog
输出:
for d in *; do git -C $d shortlog -ens --no-merges; done |
awk '{name_email=""; for (i=2; i<=NF; i++) {name_email=name_email " " $i}; count_by_user[name_email]+=$1} END {for (name_email in count_by_user) print count_by_user[name_email], name_email}'
awk
脚本解释道:
name_email="";
对于每个输入行:从空变量name_email
开头。
for (i=2; i<=NF; i++) {name_email=name_email " " $i};
将 2 个空格分隔的所有字段连接成name_email
. 即合并所有名称+电子邮件字段。
count_by_user[name_email]+=$1
创建一个新的关联数组count_by_user
并在每一行中按第一个字段的值(提交计数(增加值(默认值为 0(。
END {for (name_email in count_by_user) print count_by_user[name_email], name_email}
最后打印结果:运行count_by_user
索引(名称+电子邮件(,打印计算计数器,打印姓名+电子邮件。结果打印时未排序。可以在非常awk
的脚本中排序或使用| sort -nr
进行后处理。
使用gawk
版本的awk
开发。