为什么go基准测试在不同的地方使用相同的代码显示不同的结果



我基准测试了golang系统包"math/bits"。它很快。我对从"math/bits"复制的相同代码进行了基准测试,它大约慢了 3 倍。

我想知道在编译、链接或基准测试时,用户代码和系统代码有什么区别?

// x_test.go
package x_test
import (
    "math/bits"
    "testing"
)
// copied from "math/bits"
const DeBruijn64 = 0x03f79d71b4ca8b09
var Input uint64 = DeBruijn64
var Output int
const m0 = 0x5555555555555555 // 01010101 ...
const m1 = 0x3333333333333333 // 00110011 ...
const m2 = 0x0f0f0f0f0f0f0f0f // 00001111 ...
const m3 = 0x00ff00ff00ff00ff // etc.
const m4 = 0x0000ffff0000ffff
func OnesCount64(x uint64) int {
    const m = 1<<64 - 1
    x = x>>1&(m0&m) + x&(m0&m)
    x = x>>2&(m1&m) + x&(m1&m)
    x = (x>>4 + x) & (m2 & m)
    x += x >> 8
    x += x >> 16
    x += x >> 32
    return int(x) & (1<<7 - 1)
}
// copied from "math/bits" END

func BenchmarkMine(b *testing.B) {
    var s int
    for i := 0; i < b.N; i++ {
        s += OnesCount64(uint64(i))
    }
    Output = s
}
func BenchmarkGo(b *testing.B) {
    var s int
    for i := 0; i < b.N; i++ {
        s += bits.OnesCount64(uint64(i))
    }
    Output = s
}

运行它会显示不同的结果:

go test x_test.go  -bench=.
goos: darwin
goarch: amd64
BenchmarkMine-4         500000000                3.32 ns/op
BenchmarkGo-4           2000000000               0.96 ns/op

这两个基准应该产生类似的结果。但不是。

在深入研究 go 源代码后,我发现在编译过程中,go 用指令实现替换了 math/bits:OnesCount64: go/src/cmd/compile/internal/gc/ssa.go:3428 :makeOnesCountAMD64 .

调用math/bits.OnesCount64时,它实际上确实使用了math/bits中的代码。

最新更新