我是新手。我使用goquery从HTML页面提取数据。但问题是我正在寻找的数据不受任何HTML标记的约束。它是<br>
标记后的简单文本。我如何提取它?
编辑:这是HTML代码。
<div class="container">
<div class="row">
<div class="col-lg-8">
<p align="justify"><b>Name</b>Priyaka</p>
<p align="justify"><b>Surname</b>Patil</p>
<p align="justify"><b>Adress</b><br>India,Kolhapur</p>
<p align="justify"><b>Hobbies </b><br>Playing</p>
<p align="justify"><b>Eduction</b><br>12th</p>
<p align="justify"><b>School</b><br>New Highschool</p>
</div>
</div>
</div>
我想从这个"Priyanka"one_answers"12th"。
你想要的是:
doc.Find(".container").Find("[align="justify"]").Each(func(_ int, s *goquery.Selection) {
prefix := s.Find("b").Text()
result := strings.TrimPrefix(s.Text(), prefix)
println(result)
})
在代码前面导入字符串。如果您需要完整的代码示例,请查看此处。
尝试查询
并获取其兄弟
http://godoc.org/github.com/PuerkitoBio/goquery Selection.Siblings