我有一个超过50列和30,000行的大型数据集。其中一栏是"地区"并具有以下可能的值["Europe", "Americas", "Asia"]
我想创建一个简单的表,对所有的区域进行分组,并计算有多少实例。这是我使用的代码
df_grouped = df.groupby('Region')['Date'].count()
我得到的表是这样的:
Region Date
1,0000.00 1
10,000.00 1
10,300.00 1
134,104,360.34 1
.... ....
iA 1
iBBB- 2
null 30
谁能给我解释一下为什么会这样?我尝试了其他列,得到了类似的结果。我希望这个表只有3行,总计数显示在右边。
感谢尝试:
df_grouped = df.groupby('Region').size()