我按照air_time编写了一个语法,将航空公司数据组为组。
largest_airlines = flight_data.groupby(['AIRLINE'])['AIR_TIME'].count()
print (len(largest_airlines))
largest_airlines
输出为:
AIRLINE
AA 8720
AS 768
B6 540
DL 10539
EV 5697
F9 1305
HA 111
MQ 3314
NK 1486
OO 6425
UA 7680
US 1593
VX 986
WN 8310
Name: AIR_TIME, dtype: int64
我想过滤大于2500的数据。任何人都可以在语法中帮助我。
这取决于您要使用的方法。
例如,在熊猫中,您可以使用类似的东西:
greater_than_2500_df = largest_airlines.loc[largest_airlines['Air_Time'] < 2500]
,但是首先尝试了一些您尝试过的东西。