使用Tukey方法python从数据集中检测异常值



我有1000个观测结果的数据框架,6列

前四个coulns是int,后两个是字符串数据类型。

我需要帮助找到函数代码,可以帮助我使用tukey方法来检测异常值,并用nan值代替异常值,而不去除异常值。

我尝试了许多代码来检测异常值,但由于数据帧中的字符串数据类型,我面临错误消息。

使用df.drop()方法删除最后两个字符串列

df.drop(['B', 'C'], axis=1)

使用Tukey方法识别异常值后,使用df[i] = NaN替换异常值。

最新更新