使用beautuloup提取段落标记开头和换行符之间的文本



我有以下HTML文档

<p>
"Year: 1932"
<br>
<br>
"Total Share : 0.5 Lakhs (Pure Estimate)"
<br>
<br>
"Verdict"
</p>

我目前正在使用BeautifulSoup获取HTML中的其他元素,但我无法按原样获取这些行。我只能在一行中获取它们。

像这样尝试

from bs4 import BeautifulSoup
response_data = <Your html tags>
soup_data = BeautifulSoup(response_data, features="html5lib")
string_data = soup_data.find('p').text.strip().replace("n", ",").replace(""", "").split(',')
data_list=[]
for strng in string_data:
if strng.strip():
data_list.append(strng.strip())
print(data_list)

尝试像<br/>那样关闭br

最新更新