我有1000个观测结果的数据框架,6列
前四个coulns是int,后两个是字符串数据类型。
我需要帮助找到函数代码,可以帮助我使用tukey方法来检测异常值,并用nan值代替异常值,而不去除异常值。
我尝试了许多代码来检测异常值,但由于数据帧中的字符串数据类型,我面临错误消息。
使用df.drop()
方法删除最后两个字符串列
df.drop(['B', 'C'], axis=1)
使用Tukey方法识别异常值后,使用df[i] = NaN
替换异常值。