如何在 Go 中获取 DOM HTML



我正在用Go编写一个解析器HTML。我需要获取 HTML 并将其传递给另一个函数。

我做到了:

  1. 无法将"文档"传递给另一个函数
receivedURL, err := http.Get("http://lavillitacafe.com/")
doc, err := goquery.NewDocumentFromReader(receivedURL.Body)
//"linkScrape" this is another function
contactURL := linkScrape(doc)

  1. HTML 被部分转移到另一个函数。
resp, err := http.Get("http://lavillitacafe.com/")
    if err != nil {
        fmt.Println(err)
        return
    }
    defer resp.Body.Close()
    for true {
        bs := make([]byte, 1014)
        n, err := resp.Body.Read(bs)
                contactURL := linkScrape(bs[:n])
        if n == 0 || err != nil{
            break
        }
    }

我该怎么做对?

以下是

根据您的用例调整的基本goquery示例:

package main
import (
    "fmt"
    "log"
    "strings"
    "github.com/PuerkitoBio/goquery"
)
func findHeader(d *goquery.Document) string {
    header := d.Find("h1").Text()
    return header
}
func main() {
    // create from a string
    data := `
<html>
    <head>
        <title>My document</title>
    </head>
    <body>
        <h1>Header</h1>
    </body>
</html>`
    doc, err := goquery.NewDocumentFromReader(strings.NewReader(data))
    if err != nil {
        log.Fatal(err)
    }
    fmt.Println(findHeader(doc))
}

相关内容

  • 没有找到相关文章

最新更新