如何使用密度核估计进行异常值检测



我有一个名为"price"的变量,其分布看起来非常偏斜。我计划使用核密度估计值检测异常值。这个有什么好主意吗?

谢谢!

如果我知道您正在寻找低振幅的局部最大值? 您可以检查斜率过渡的核密度。 正态分布应该有 POS-NEG。 如果您的平滑函数足够平滑,您的主数据应如下所示。 异常值将在斜率上添加额外的 POS-NEG 过渡。

斜率函数的计算方式与核本身类似,但使用所选窗口函数的导数。

相应地调整平滑参数,并删除导致局部最大振幅过高的样本。

相关内容

  • 没有找到相关文章

最新更新