GoColly中执行网络请求的默认模式是什么?由于收集器中有Async
方法,我假设默认模式是同步的。然而,当我在程序中执行这8个请求时,除了需要使用Wait
进行异步模式之外,我没有看到什么特别的区别。该方法似乎只控制程序(其他代码(的执行方式,并且请求总是异步的。
package main
import (
"fmt"
"github.com/gocolly/colly/v2"
)
func main() {
urls := []string{
"http://webcode.me",
"https://example.com",
"http://httpbin.org",
"https://www.perl.org",
"https://www.php.net",
"https://www.python.org",
"https://code.visualstudio.com",
"https://clojure.org",
}
c := colly.NewCollector(
colly.Async(true),
)
c.OnHTML("title", func(e *colly.HTMLElement) {
fmt.Println(e.Text)
})
for _, url := range urls {
c.Visit(url)
}
c.Wait()
}
默认集合是同步的。
令人困惑的地方可能是收集器选项colly.Async()
,它忽略了实际参数。事实上,在撰写本文时的实现是:
func Async(a ...bool) CollectorOption {
return func(c *Collector) {
c.Async = true // uh-oh...!
}
}
基于这个问题,这样做是为了向后兼容性,所以(我相信(你可以传递一个没有参数的选项,它仍然可以工作,例如:
colly.NewCollector(colly.Async()) // no param, async collection
如果您完全删除async选项并仅使用colly.NewCollector()
进行实例化,则网络请求将明显是连续的——也就是说,您也可以删除c.Wait()
,程序不会立即退出。