美丽的汤:如何从这个结构中提取文本:



我想访问title = ""中的时间戳文本

并得到这个字符串"23.12.2019 13:05:24

[<div class="pull_right date details" title="23.12.2019 13:05:24">
13:05
</div>]

我已经知道访问此div中的正确文本。但碰巧这只是一个小时。我需要完整的时间戳。

我目前正在使用此结构:

ltimestamp = []
for tag in divTag:
tdTags = tag.find_all("div", {"class": "pull_right date details"})    
for tag in tdTags:
ltimestamp.append(tag.text)

当你有这个元素时<div class="pull_right date details" title="23.12.2019 13:05:24">13:05</div>

如果您想在标签内获取 '13:05' => 值,请执行此操作print(tdTags.text)

要获取属性("title"(的值('23.12.2019 13:05:24'(,请执行以下操作print(tdTags['title'])

我会回来 美丽的汤 链接到这个解释。 之前在某处读过

文档网址:https://www.crummy.com/software/BeautifulSoup/bs4/doc/#attributes

最新更新