为了处理两列中的NaN值,我将它们替换为0。然后,我运行了pandas-descripte函数,但我希望它排除0个值。我该怎么做?因为现在,它将0值显示为列的最小值。
df[df["Column_name"] != 0].describe()
或
data.dropna(inplace = True).describe()
我认为最简单的解决方案是保存NaN
值并只调用describe。默认情况下,函数将忽略NaN
值来汇总数据,如panda文档中所述。
尝试将data.dropna()
保存在新变量中,或者只复制不带inplace
参数的结果。这是必要的,因为data.dropna(inplace = True)
的返回是None
。您可以通过打印其结果来确认这一点:
print(data.dropna(inplace = True)) # prints "None"
解决方案
使用新的数据帧:
new_df = data.dropna(inplace = True)
new_df.describe()
没有新的数据帧:
data.dropna().copy().describe()