我只是想尝试goroutine切换上下文的速度,所以我写了下面的代码。令我惊讶的是,多个gorountines的运行速度比不需要切换上下文的版本更快(我将程序设置为仅在一个CPU内核中运行(。
package main
import (
"fmt"
"runtime"
"sync"
"time"
)
func main() {
runtime.GOMAXPROCS(1)
t_start := time.Now()
sum := 0
for j := 0; j < 10; j++ {
sum = 0
for i := 0; i < 100000000; i++ {
sum += i
}
}
fmt.Println("single goroutine takes ", time.Since(t_start))
var wg sync.WaitGroup
t_start = time.Now()
for j := 0; j < 10; j++ {
wg.Add(1)
go func() {
sum := 0
for i := 0; i < 100000000; i++ {
sum += i
}
defer wg.Done()
}()
}
wg.Wait()
fmt.Println("multiple goroutines take ", time.Since(t_start))
}
单个 goroutines 需要 251.690788ms,多个 goroutines 需要 254.067156ms
单个 goroutine 应该运行得更快,因为单个 goroutine 不需要更改上下文。然而,答案是相反的,单一模式总是更慢。这个节目发生了什么?
您的并发版本 非并发版本会做几件事,这会使其变慢:
- 它正在创建一个必须分配的新
sum
值。非并发版本只是重置现有值。这可能影响很小,但有所不同。 - 您使用的是候补组。显然,这会增加开销。
defer wg.Done()
中的defer
也会增加开销,大致相当于额外的函数调用。
还有其他微妙的差异。
简而言之:你的基准是无效的,因为你在比较苹果和橙子。
更重要的是:这首先不是一个有用的基准,因为它是一个完全人为的工作负载。