熊猫按 Q1 和 Q3 的聚合分组

我有一个从这个命令生成的示例数据集

df = pd.DataFrame({"A": list(range(1, 21))}, "B": ["a"]*10 + ["b"]*10})

所以，我的数据看起来像这样

我想按 B 列获取第一个分位数 (Q1( 和第三个分位数 (Q3( 的输出组。预期输出应为

B     Q1     Q3
a   3.25   7.75
b  13.25  17.75

我尝试按聚合进行分组，如下所示

df.groupby("B").agg({"A": np.quantile(0.25), "A": np.quantile(0.75)})

但它不起作用，因为 np.quantile 需要解析输入数组和阈值。我可以有你的建议如何获得预期的输出吗？我想应用于相当大的真实数据。谢谢。

将DataFrameGroupBy.quantile与Series.unstack一起使用并重命名列：

df1 = (df.groupby("B")['A']
.quantile([0.25, 0.75])
.unstack()
.rename(columns={0.25:'Q1', 0.75:'Q3'}))
print (df1)
Q1     Q3
B              
a   3.25   7.75
b  13.25  17.75

相关内容

最新更新

热门标签：