"trimmed"在 SciPy 统计函数中是什么意思?



当我尝试在 SciPy 的统计包中找到所需的函数时,我发现某些函数被指示为"修剪"结果而设计,例如修剪方差、修剪最大值等:http://docs.scipy.org/doc/scipy/reference/stats.html#statistical-functions。你能告诉我这里的"修剪"是什么意思吗?"修剪"结果是否与正常结果相同?谢谢。

有两种修剪函数

基于值的修剪:

修剪(删除)超出下限和上限区间的所有观测值。这将检查每个值是否在间隔中,如果值在间隔中,则保留该值。scipy.stats tmean 中的示例

基于分数的修剪:

对观测值

进行排序后,从每个尾部修剪(删除)一小部分观测值,例如丢弃最小值的 10% 和最大值的 10%。这只是从排序数组中取出中心切片。scipy.stats trim_mean 中的示例

这两种修剪都用于获取对异常值具有鲁棒性的统计数据。

如果您阅读已链接到的文档,您会发现修剪后的版本包括limitsinclusive可选参数,并且被描述为,例如用于tmean

此函数查找给定值的算术平均值,忽略 给定limits之外的值。

  • 限制:None或(下限,上限),可选

    输入数组中的值小于下限或大于 上限将被忽略。当限制为 None 时,则所有 使用值。 元组中的任一极限值也可以 None表示半开放间隔。默认值为 None .

  • 包含 :(布尔值,布尔值),可选

    由(下旗、上旗)组成的元组。 这些标志 确定值是完全等于下限还是上限 都包括在内。默认值为 (True, True)

最新更新