嗨,我使用这段代码来填充我的数据集随机NaN值:
np.random.seed(1234)
total_cells = df.shape[0] * df.shape[1]
df = df.reset_index().melt(id_vars = "index")
df.loc[np.random.randint(0, total_cells, int(total_cells * .25)), "value"] = np.NaN
df.pivot(index = "index", columns = "variable")
当我选中
时,我的列看起来像df.columns.to_list()
[('value', 'AGE'), ('value','DATE'),.........,('value','TIME')]
但我希望他们只是[‘年龄’,‘日期’,……,"时间")。
我该怎么做呢?
将参数values
添加到pivot
是更简单的方法:
df.pivot(index = "index", columns = "variable", value='value')
或:
df.pivot(index = "index", columns = "variable").droplevel(axis=1, level=0)