图书馆能做什么

  • 本文关键字:图书馆 go go-colly
  • 更新时间 :
  • 英文 :


go colly库能否抓取div标签下的所有HTML标签和文本内容?如果是,如何?我可以获取div标签下的所有文本。像这样:

c.OnHTML("body .post-topic-main .post-topic-des", func(e *colly.HTMLElement) {
text = strings.TrimSpace(e.Text)
})

但是我不知道如何在div标记下获得HTML标记。

如果您正在查找innerHTML,则DOM可以使用Html方法(e.DOM.Html()(访问它。

c.OnHTML("body .post-topic-main .post-topic-des", func(e *colly.HTMLElement) {
html, _ := e.DOM.Html()
log.Println(html)
})

如果您在founded元素下查找特殊标记,ForEach可以用于此目的。第一个参数是选择器,第二个参数是回调函数。回调函数将对每个与选择器匹配并且也是e元素成员的元素进行迭代。

更多信息:https://pkg.go.dev/github.com/gocolly/colly@v1.2.0#HTMLElement.ForEach

c.OnHTML("body .post-topic-main .post-topic-des", func(e *colly.HTMLElement) {
text := strings.TrimSpace(e.Text)
log.Println(text)
e.ForEach("div", func(_ int, el *colly.HTMLElement) {
text := strings.TrimSpace(e.Text)
log.Println(text)
})
})

相关内容

  • 没有找到相关文章

最新更新