如何以表格格式将HTML tbody数据解析为Python



我是python的新手,我正在尝试用python将这些数据解析为表格格式。我考虑了一些例子,但没能得到理想的结果。

有人能帮我处理这个吗

<tbody>
<tr><td>Kupon in %</td><td>36,520</td></tr>
<tr><td>Erstes Kupondatum</td><td>03.07.2017</td></tr>
<tr><td>Letztes Kupondatum</td><td>03.04.2022</td></tr>
<tr><td>Zahlweise Kupon</td><td>Zinszahlung normal</td></tr>
<tr><td>Spezialkupon Typ</td><td>Zinssatz variabel</td></tr>

以这种方式需要这些数据:

库邦%36520Erstes Kupondatum 2017年7月3日Letztes Kupondatum 2022年4月3日

您可以通过两种方式实现这一点1。使用列表理解和2。使用for循环两者都会产生相同的结果,这取决于你的选择。

from bs4 import BeautifulSoup
html = """<tbody>
<tr><td>Kupon in %</td><td>36,520</td></tr>
<tr><td>Erstes Kupondatum</td><td>03.07.2017</td></tr>
<tr><td>Letztes Kupondatum</td><td>03.04.2022</td></tr>
<tr><td>Zahlweise Kupon</td><td>Zinszahlung normal</td></tr>
<tr><td>Spezialkupon Typ</td><td>Zinssatz variabel</td></tr>"""
#1
soup = BeautifulSoup(html,'lxml')
print(' '.join([td.text for td in soup.find_all('td')]))
# 2 
tags = []
tr = soup.find_all('td')
for td in tr:
tags.append(td.text)
print(' '.join(tags))

产量:库邦%36520 Erstes Kupondatum 2017年7月3日Letztes Kupondatum2022年4月3日Zahlweise Kupon Zinszahlung正常Spezialkon类型Zinssatz可变

最新更新