我有一个数据框架,其中有100行内的10个独特的国家。现在通过应用value_counts(),我试图获得每个国家的出现频率。我需要它在一个数据框中
This is the output of value_counts:
South Africa 166
USA 164
Spain 134
Sweeden 119
France 115
Russia 97
India 95
UK 95
Ukraine 9
Ireland 5
Name: Country, dtype: int64
我需要这是一个新的数据框架,但它应该有索引值为0,1,2....我在下面试过国家= pd.DataFrame (so_survey_df['国家'].value_counts ())
但是它给出了一个以国家名称作为索引的数据框架。
所以基本上你需要计算值,重置索引并更改列名,因此一行代码可以是:
country = so_survey_df['Country'].value_counts().reset_index(name='Count').rename(columns={'index':'Country'})
试试这个:
pd.Series({val:k for k,val in df['country'].value_counts().iteritems()})
输出:
166 South Africa
164 USA
134 Spain
119 Sweeden
115 France
97 Russia
95 UK
9 Ukraine
5 Ireland
dtype: object