使用 pd.pivot_table(df, index=[col1], values=[val1])
时,结果枢轴表降低了 df
的结果,其中 col1
为 NaN
。
我可以用df[col1].fillna('#', inplace=True)
预填充NaN
,但这是我不想做的数据。
我也可以在上面进行预填充到df2
之前进行df2 = df.copy()
,但是我的数据很大,因此不想不必要地进行额外的副本。
有没有一种方法可以在指定为索引的列中使用NaN
值的数据框,而无需枢轴删除NaN
索引及其汇总值?
目前,在索引中使用NaN
作为枢轴表中没有一种方法。随着您的经历,它将被静静地丢弃。我认为您今天最好的选择是使用fillna
执行枢轴的路线。
在stackoverflow上询问这是否需要更多颜色。
我也很难找到一个明确的答案;我怀疑它与默认情况下删除NaN
的groupby
有关。我在Github上开了一个问题,并得到了确认。这是一个已知的问题,甚至有PR(可能是陈旧的)。