为什么单个 goroutines 在运行时运行得比多个 goroutines 慢.GOMAXPROCS(1).



我只是想尝试goroutine切换上下文的速度,所以我写了下面的代码。令我惊讶的是,多个gorountines的运行速度比不需要切换上下文的版本更快(我将程序设置为仅在一个CPU内核中运行(。

package main
import (
    "fmt"
    "runtime"
    "sync"
    "time"
)
func main() {
    runtime.GOMAXPROCS(1)
    t_start := time.Now()
    sum := 0
    for j := 0; j < 10; j++ {
        sum = 0
        for i := 0; i < 100000000; i++ {
            sum += i
        }
    }
    fmt.Println("single goroutine takes ", time.Since(t_start))
    var wg sync.WaitGroup
    t_start = time.Now()
    for j := 0; j < 10; j++ {
        wg.Add(1)
        go func() {
            sum := 0
            for i := 0; i < 100000000; i++ {
                sum += i
            }
            defer wg.Done()
        }()
    }
    wg.Wait()
    fmt.Println("multiple goroutines take ", time.Since(t_start))
}

单个 goroutines 需要 251.690788ms,多个 goroutines 需要 254.067156ms

单个 goroutine 应该运行得更快,因为单个 goroutine 不需要更改上下文。然而,答案是相反的,单一模式总是更慢。这个节目发生了什么?

您的并发版本 非并发版本会做几件事,这会使其变慢:

  1. 它正在创建一个必须分配的新sum值。非并发版本只是重置现有值。这可能影响很小,但有所不同。
  2. 您使用的是候补组。显然,这会增加开销。
  3. defer wg.Done()中的defer也会增加开销,大致相当于额外的函数调用。
可能

还有其他微妙的差异。

简而言之:你的基准是无效的,因为你在比较苹果和橙子。

更重要的是:这首先不是一个有用的基准,因为它是一个完全人为的工作负载。