使用 Requests-HTML <h4> (Requests-HTML， Python) 抓取文本

我正在尝试提取CPU的套接字类型，如下图中所示。我已经确定插座类型在<h4>套接字标题下，如下图所示。

到目前为止，我已经能够刮擦.spec.block并找到所有嵌套在其中的<h4>'s。但是，我无法在每个标题下都有文字

这是我的代码

from requests_html import HTMLSession
session = HTMLSession()
r = session.get('https://au.pcpartpicker.com/product/' + jLF48d)
about = r.html.find('.specs.block')[0]
about = about.find('h4')
print(about.text)

此打印

 [ <Element 'h4' >, <Element 'h4' >, <Element 'h4' >, <Element 'h4' >,
 <Element 'h4' >, <Element 'h4' >, <Element 'h4' >, <Element 'h4' >,
 <Element 'h4' >, <Element 'h4' >, <Element 'h4' >]

但是，当我将打印语句更改为：

print(about.text)

我有以下错误：

attributeError：'list'对象没有属性'text'

更新：

print(about[0].text)

此代码打印：

制造商 AMD 这是第一个标题和文字，但是我需要第四

知道我可以使用什么代码来达到所需的结果？

如果您需要更多信息，请告诉我。

替换：打印（大约[0] .Text）

print(about[3].text)

如上上面的问题所示，我解决了问题！

相关内容

最新更新

热门标签：