使用Pandas python将表作为响应存储到DataFrame



我有一部分代码提取特定页面的源代码,这里是HTML内容的示例

<meta content="text/html; charset=utf-8" http-equiv="Content-Type"/>
<style type="text/css">
th,td{
text-align: center !important;
}

</style>
<table class="table table-striped">
<tr class="">
<th style="text-align:center;" width="5%">م</th>
<th style="text-align:center;" width="15%">التاريخ</th>
<th style="text-align:center;">العملية</th>
</tr>
<tr align="center" class="resultRowOdd" style="line-height:25px;">
<td>1</td>
<td dir="ltr">2021-02-02</td>
<td style="padding-right:10px;">محضراثبات حاله</td>
</tr>
<tr align="center" class="resultRowEven" style="line-height:25px;">
<td>2</td>
<td dir="ltr">2021-02-02</td>
<td style="padding-right:10px;">محضرحجزتنفيذى بما للمدين لدى الغير</td>
</tr>
<tr align="center" class="resultRowOdd" style="line-height:25px;">
<td>3</td>
<td dir="ltr">2021-01-20</td>
<td style="padding-right:10px;">طلب حجزما للمدين لدى الغير</td>
</tr>
<tr align="center" class="resultRowEven" style="line-height:25px;">
<td>4</td>
<td dir="ltr">2020-09-28</td>
<td style="padding-right:10px;">امر منع سفر</td>
</tr>
<tr align="center" class="resultRowOdd" style="line-height:25px;">
<td>5</td>
<td dir="ltr">2020-09-22</td>
<td style="padding-right:10px;">محضرحجزتنفيذى بما للمدين لدى الغير</td>
</tr>
<tr align="center" class="resultRowEven" style="line-height:25px;">
<td>6</td>
<td dir="ltr">2020-09-07</td>
<td style="padding-right:10px;">امر ضبط واحضار مدين</td>
</tr>
<tr align="center" class="resultRowOdd" style="line-height:25px;">
<td>7</td>
<td dir="ltr">2020-09-02</td>
<td style="padding-right:10px;">محضرحجزتنفيذى بما للمدين لدى الغير</td>
</tr>
<tr align="center" class="resultRowEven" style="line-height:25px;">
<td>8</td>
<td dir="ltr">2020-03-03</td>
<td style="padding-right:10px;">طلب حجزما للمدين لدى الغير</td>
</tr>
<tr align="center" class="resultRowOdd" style="line-height:25px;">
<td>9</td>
<td dir="ltr">2020-03-01</td>
<td style="padding-right:10px;">طـلب ضبط واحضار مدين</td>
</tr>
<tr align="center" class="resultRowEven" style="line-height:25px;">
<td>10</td>
<td dir="ltr">2020-03-01</td>
<td style="padding-right:10px;">طلب حجز و ضبط سيارة</td>
</tr>
<tr align="center" class="resultRowOdd" style="line-height:25px;">
<td>11</td>
<td dir="ltr">2020-03-01</td>
<td style="padding-right:10px;">طلب حجزما للمدين لدى الغير</td>
</tr>
<tr align="center" class="resultRowEven" style="line-height:25px;">
<td>12</td>
<td dir="ltr">2020-03-01</td>
<td style="padding-right:10px;">طلب منع سفر</td>
</tr>
<tr align="center" class="resultRowOdd" style="line-height:25px;">
<td>13</td>
<td dir="ltr">2019-10-27</td>
<td style="padding-right:10px;">ايصال تحصيل</td>
</tr>
<tr align="center" class="resultRowEven" style="line-height:25px;">
<td>14</td>
<td dir="ltr">2019-06-24</td>
<td style="padding-right:10px;"> جلسة المحكمة الكلية - حكم قطعي  </td>
</tr>
<tr align="center" class="resultRowOdd" style="line-height:25px;">
<td>15</td>
<td dir="ltr">2019-06-10</td>
<td style="padding-right:10px;"> جلسة المحكمة الكلية - قضية محجوزة للحكم  - الجلسة القادمة (24-06-2019)</td>
</tr>
<tr align="center" class="resultRowEven" style="line-height:25px;">
<td>16</td>
<td dir="ltr">2019-05-30</td>
<td style="padding-right:10px;"> اعلان بجلسة</td>
</tr>
<tr align="center" class="resultRowOdd" style="line-height:25px;">
<td>17</td>
<td dir="ltr">2019-05-06</td>
<td style="padding-right:10px;"> جلسة المحكمة الكلية - قرار تأجيل للاعلان  - الجلسة القادمة (10-06-2019)</td>
</tr>
<tr align="center" class="resultRowEven" style="line-height:25px;">
<td>18</td>
<td dir="ltr">2019-04-23</td>
<td style="padding-right:10px;"> اعلان بجلسة</td>
</tr>
<tr align="center" class="resultRowOdd" style="line-height:25px;">
<td>19</td>
<td dir="ltr">2019-04-14</td>
<td style="padding-right:10px;"> سجلت القضية في دائرة  تجارى كلي في  المحكمة الكلية برقم  5874 سنة  2019</td>
</tr>
</table>

我已经使用了requests包和BeautfiulSoup

soup = BeautifulSoup(r.text, 'html.parser')
print(soup)

到目前为止一切都很好。我现在要做的是使用Pandas将响应中的表转换为DataFrame ..你能帮我一下吗?

我偶然发现了解决这个问题的办法

import pandas as pd
df = pd.read_html(r.text)[0]

所以使用read_html是熊猫的一大特色。

您可以使用pd.read_html

dfs = pd.read_html(r.text)
print(df[0])

输出
م     التاريخ                                            العملية
0    1  2021-02-02                                     محضراثبات حاله
1    2  2021-02-02                 محضرحجزتنفيذى بما للمدين لدى الغير
2    3  2021-01-20                         طلب حجزما للمدين لدى الغير
3    4  2020-09-28                                        امر منع سفر
4    5  2020-09-22                 محضرحجزتنفيذى بما للمدين لدى الغير
5    6  2020-09-07                                امر ضبط واحضار مدين
6    7  2020-09-02                 محضرحجزتنفيذى بما للمدين لدى الغير
7    8  2020-03-03                         طلب حجزما للمدين لدى الغير
8    9  2020-03-01                               طـلب ضبط واحضار مدين
9   10  2020-03-01                                طلب حجز و ضبط سيارة
10  11  2020-03-01                         طلب حجزما للمدين لدى الغير
11  12  2020-03-01                                        طلب منع سفر
12  13  2019-10-27                                        ايصال تحصيل
13  14  2019-06-24                     جلسة المحكمة الكلية - حكم قطعي
14  15  2019-06-10  جلسة المحكمة الكلية - قضية محجوزة للحكم - الجل...
15  16  2019-05-30                                        اعلان بجلسة
16  17  2019-05-06  جلسة المحكمة الكلية - قرار تأجيل للاعلان - الج...
17  18  2019-04-23                                        اعلان بجلسة
18  19  2019-04-14  سجلت القضية في دائرة تجارى كلي في المحكمة الكل...

相关内容

  • 没有找到相关文章

最新更新