调用pandas-descripte函数时排除一个值



为了处理两列中的NaN值,我将它们替换为0。然后,我运行了pandas-descripte函数,但我希望它排除0个值。我该怎么做?因为现在,它将0值显示为列的最小值。

df[df["Column_name"] != 0].describe()

data.dropna(inplace = True).describe() 

我认为最简单的解决方案是保存NaN值并只调用describe。默认情况下,函数将忽略NaN值来汇总数据,如panda文档中所述。

尝试将data.dropna()保存在新变量中,或者只复制不带inplace参数的结果。这是必要的,因为data.dropna(inplace = True)的返回是None。您可以通过打印其结果来确认这一点:

print(data.dropna(inplace = True))  # prints "None"

解决方案

使用新的数据帧:

new_df = data.dropna(inplace = True)
new_df.describe()

没有新的数据帧:

data.dropna().copy().describe()

最新更新