我的目标是分析城市环境中私立学校与私立学校的学费变更。
我有一个数据框架,随着时间的推移,美国所有私立学校的学费成本(tuit_cost
)。DataFrame tuit_cost
包含历史学费成本的列以及两个名为['State','City/Town Name']
的列。
我也有一个单独的私立学校数据框架,这些数据被归类为"城市"地区(urban_schools
)。此数据框只有两列-['State','City/Town Name']
。
我合并了数据范围,以创建一个仅使用城市学校的历史学费数据创建数据框。
urban_school_tuit = pd.merge(urban_schools, tuit_cost, how='left', left_on= ['State','City/Town Name'], right_on=['State','City/Town Name']).dropna()
现在,我想通过从tuit_cost
中删除urban_school_tuit
中的所有行来创建一个仅使用农村学校的历史学费数据的数据框架。
这样做的最有效方法是什么?
谢谢!
能够将其修补在一起以创建所需的数据框(在Python 3)...
rural_schools = tuit_cost.drop(list(zip(urban_schools['State'],urban_schools['City/Town Name'])))
对任何进一步的指导或建议开放。