当我尝试在 SciPy 的统计包中找到所需的函数时,我发现某些函数被指示为"修剪"结果而设计,例如修剪方差、修剪最大值等:http://docs.scipy.org/doc/scipy/reference/stats.html#statistical-functions。你能告诉我这里的"修剪"是什么意思吗?"修剪"结果是否与正常结果相同?谢谢。
有两种修剪函数
基于值的修剪:
修剪(删除)超出下限和上限区间的所有观测值。这将检查每个值是否在间隔中,如果值在间隔中,则保留该值。scipy.stats tmean
中的示例
基于分数的修剪:
对观测值进行排序后,从每个尾部修剪(删除)一小部分观测值,例如丢弃最小值的 10% 和最大值的 10%。这只是从排序数组中取出中心切片。scipy.stats trim_mean
中的示例
这两种修剪都用于获取对异常值具有鲁棒性的统计数据。
如果您阅读已链接到的文档,您会发现修剪后的版本包括limits
和inclusive
可选参数,并且被描述为,例如用于tmean
:
此函数查找给定值的算术平均值,忽略 给定
limits
之外的值。
限制:
None
或(下限,上限),可选输入数组中的值小于下限或大于 上限将被忽略。当限制为
None
时,则所有 使用值。 元组中的任一极限值也可以None
表示半开放间隔。默认值为None
.包含 :(布尔值,布尔值),可选
由(下旗、上旗)组成的元组。 这些标志 确定值是完全等于下限还是上限 都包括在内。默认值为
(True, True)
。