计算四分位数不准确



我正在尝试计算列的四分位数。然而,我使用的任何类型的函数(到目前为止,我尝试了numpy百分位数和pandas分位数,插值最接近、更高、更低、线性(,它们总是返回不准确的四分位数。我从这里的这个链接查看了它。有没有什么函数可以真正返回准确的四分位数,或者最好制作我们自己的函数来准确计数?因为我在另一个答案中看到有人创建了自己的函数来计算

这是我的专栏,结果假设是Q1,Q3 = 200,650,但显示的是Q1,Q3 = 200,500。无论我用什么样的插值,结果总是不准确的。

cols = pd.DataFrame({'numbers':[100,300,200,400,500,6000,800,200,200]})

在我们删除重复项后,当您不删除重复项时,quantile的值将关闭

s=pd.DataFrame({'numbers':[100,300,200,400,500,6000,800,200,200]})
s.drop_duplicates().quantile([0.25,0.75])
Out[13]: 
numbers
0.25    250.0
0.75    650.0

最新更新