Git压缩作者的顺序提交以压缩历史



我的团队正在开发一个长期运行的功能分支,该分支现在有数百次提交,现在我需要将其合并到master中进行生产发布。

我不想在那个分支中有那么多提交,因为很多提交都是为了修复错误而完成的,每次提交只更改几行。

在Github上的PR创建页面上,它将提交限制在250。

来自Github-"这个比较太大了!我们只显示了最近的250次提交"

因此,我决定压缩历史,将作者的一组顺序提交压缩为一个提交。

例如,假设我们有来自作者A、B、C和D的提交,如:A - A - A - B - B - A - C - D - D - B- B -A,则生成的提交日志将有(3) - B(2)-A-C-D (2) - B(2)-A,其中X`(N)是来自作者X的N个提交的压缩提交。

编辑:我知道这将需要一个脚本,我正在寻找同样的。我不想通过交互式重新基准来做同样的事情。

没有任何内置功能;你必须自己写剧本。

要做到这一点,请从git rev-listgit log开始(两者基本上都做相同的事情,但命令行选项有所不同),以遍历所有要扫描的提交。您的目标是将提交复制但压缩到一个新的临时分支上。例如,假设提交都是在分支feature上进行的,并且要合并到分支target中,您可以获得要检查的提交列表:

git rev-list --reverse --topo-order target..feature > /tmp/list

这里的输出是提交SHA-1 ID的列表。对于每次提交,您都希望找到作者,可能还有提交消息:

while read sha1; do
    author_name=$(git log -n 1 --format=%an $sha1)
    ...
done < /tmp/list

如果当前作者名称与前一作者名称相同,则您只想累积此提交,但如果不同,则需要发出提交ID。由于最初未设置$author_name,因此它将是空字符串,因此第一次提交将与前一个作者不匹配,但您必须特别处理此问题(以及最终提交ID),因为您总是希望累积第一次提交,并在最后一次提交后或作者更改时采取行动。因此CCD_ 9部分有点复杂。我们还需要一些设置工作来创建和进入一个临时分支,它的第一个提交指向分支target的顶端。我们将在此处使用匿名分支,而不是使用命名的临时分支。

最后,进行压缩提交的方法特别棘手:最简单的方法是使用管道命令git commit-tree,然后推进临时分支。

把所有这些放在一起,我们得到了以下完全未经测试的代码:

# add new squash-style commit using commit $1
make_squash_commit() {
    local sha1=$1 tree new_sha1
    tree=$(git rev-parse $sha1^{tree})
    new_sha1=$(git commit-tree $tree -p HEAD)
    git update-ref -m "squash $sha1" HEAD $new_sha1
}
set -e
git rev-list --reverse --topo-order target..feature > /tmp/list
git checkout --detach target
: > /tmp/accum_log
prev_sha1=""
while read sha1; do
    author_name=$(git log -n 1 --format=%an $sha1)
    if [ "$author_name" != "$prev_name" -a -n "$prev_sha1" ]; then
        make_squash_commit $prev_sha1 < /tmp/accum_log
        : > /tmp/accum_log
    fi
    prev_name="$author_name"
    prev_sha1=$sha1
    git log -n 1 --format="%B" $sha1 >> /tmp/accum_log
done < /tmp/list
if [ -z "$prev_sha1" ]; then
    echo "Warning: no commits found to squash!"
    sha1=$(git rev-parse target)
fi
# squash final commit, then give anonymous branch a name
make_squash_commit $prev_sha1 < /tmp/accum_log
git checkout -b temp_branch
rm /tmp/list /tmp/accum_log

这个脚本中有一个故意的缺陷:它使用当前日期和时间(这是合适的,因为你把多个作者的提交搞得一团糟,不管他们是否同意,都会把它们压扁),让作为每一个提交的作者和提交者。您可以通过在git commit-tree步骤中设置所有适当的环境变量来"修复"此问题(请参阅其文档)。

控制台:

git log --format="p|%h|%an|%s" --no-merges -n 190 | tail -r  > commits.txt

PHP:

$fp = fopen("./commits.txt", "r");
$commits = array();
$previous_author = '';
while (($line = fgets($fp)) !== FALSE) {
  list($mode, $sha, $current_author, $subject) = explode('|', $line);
  if ($previous_author == '' || $previous_author !== $current_author) {
    $previous_author = $current_author;
  }
  else {
    $mode = 'f';
  }
  $output[] = implode(' ', array($mode, $sha, $subject));
}
fclose($fp);
print implode(' ', $output);

控制台:

git rebase -i HEAD~190

在交互式编辑器中,删除了所有内容,并粘贴了上面php脚本的输出。我可以达到预期的结果。

最新更新