Python 获取城市、州、地区的列表



我有一个包含一列城市的数据框。我希望将城市与其地区相匹配。例如,旧金山将是西部

这是我的原始数据帧:

data = {'city': ['San Francisco', 'New York', 'Chicago', 'Philadelphia', 'Boston'], 
    'year': [2012, 2012, 2013, 2014, 2014], 
    'reports': [4, 24, 31, 2, 3]}
df = pd.DataFrame(data, index = ['Cochice', 'Pima', 'Santa Cruz', 'Maricopa', 'Yuma'])
df
city           year   reports
San Francisco  2012   Cochice
New York       2012   Pima
Chicago        2013   Santa Cruz
Philadelphia   2014   Maricopa
Boston         2014   Yuma

在这里,我按状态提取包含区域的数据。但是,它不包含城市。

pd.read_csv('https://raw.githubusercontent.com/cphalpert/census-regions/master/us%20census%20bureau%20regions%20and%20divisions.csv')

如何获取每个城市的州?这样,我就可以将包含状态的原始数据帧与具有区域的第二个数据帧联接。

在这个Github项目中,有一个CSV,创建者声称它包含所有美国城市和州。

提供了以下数据:

City|State short name|State full name|County|City Alias Mixed Case

例:

San Francisco|CA|California|SAN FRANCISCO|San Francisco
San Francisco|CA|California|SAN MATEO|San Francisco Intnl Airport
San Francisco|CA|California|SAN MATEO|San Francisco
San Francisco|CA|California|SAN FRANCISCO|Presidio
San Francisco|CA|California|SAN FRANCISCO|Bank Of America
San Francisco|CA|California|SAN FRANCISCO|Wells Fargo Bank
San Francisco|CA|California|SAN FRANCISCO|First Interstate Bank
San Francisco|CA|California|SAN FRANCISCO|Uc San Francisco
San Francisco|CA|California|SAN FRANCISCO|Union Bank Of California
San Francisco|CA|California|SAN FRANCISCO|Irs Service Center
San Francisco|CA|California|SAN FRANCISCO|At & T
San Francisco|CA|California|SAN FRANCISCO|Pacific Gas And Electric
Sacramento|CA|California|SACRAMENTO|Sacramento
Sacramento|CA|California|SACRAMENTO|Ca Franchise Tx Brd Brm
Sacramento|CA|California|SACRAMENTO|Ca State Govt Brm

我建议您解析上述文件以提取所需的信息(在这种情况下,给定特定城市的州),然后与您拥有的其他 csv 上的区域相关联。

更好的办法是使用您访问的所有 csv 创建自己的表,以仅包含您真正需要的信息。

相关内容

  • 没有找到相关文章

最新更新