我们如何在一步中使用iloc
方法删除Pandadataframe
中的第一行和最后一行,类似于[[0:, :-1]]
,但是,如果我只需要通过iloc
获得第一行和最终一行,如下所示。
数据帧:
import pandas as pd
import numpy as np
import requests
pd.set_option('display.max_rows', None)
pd.set_option('display.max_columns', None)
pd.set_option('display.width', None)
pd.set_option('expand_frame_repr', True)
header={"User-Agent":"Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/50.0.2661.75 Safari/537.36", "X-Requested-With":"XMLHttpRequest"}
url = 'https://www.worldometers.info/coronavirus/'
r = requests.get(url, headers=header)
#read second table in url
df = pd.read_html(r.text)[1].iloc[[0, -1]]
#replace nan to zero
df = df[['Country,Other', 'TotalCases', 'NewCases', 'TotalDeaths', 'NewDeaths', 'TotalRecovered', 'ActiveCases', 'Serious,Critical']].replace(np.nan, "0")
print(df)
输出:
下面我可以得到第一个和最后一个,我需要删除。
Country,Other TotalCases NewCases TotalDeaths NewDeaths TotalRecovered ActiveCases Serious,Critical
0 World 2828826 +105,825 197099.0 +6,182 798371.0 1833356 58531.0
213 Total: 2828826 +105,825 197099.0 +6,182 798371.0 1833356 58531.0
然而,我可以删除最后一行作为df = pd.read_html(r.text)[1].iloc[:-1]
,然而,到目前为止,我还知道其他方法,如下面所示,但这些方法分为两步。
df.drop(df.tail(1).index,inplace=True)
df.drop(df.head(1).index,inplace=True)
您可以使用过滤:
df = pd.read_html(r.text)[1].iloc[1:-1]
这将为你带来从中国到也门的每一个国家。