打印空值的部分



我正在使用titanic数据集。我想知道如何显示火车集的空值部分。

这是我的代码:`

train_count_of_missval_by_col = (train.isnull().sum())
print('----- all columns along with count of missing value')
print(train_count_of_missval_by_col)
print('----only columns which has missing values----')
print(train_count_of_missval_by_col[train_count_of_missval_by_col>0])
print('----only columns which has missing data to total observations----')
print(train_count_of_missval_by_col[train_count_of_missval_by_col>0]/train.shape[])`

不幸的是,代码的最后一行生成了错误。在最后一行添加/编辑什么以使代码正常工作?

我不确定是否有具体的操作。info()向您显示原始#,告诉总行数,但没有%的参数。此外,.info()作为None类型的对象返回,因此您不能访问该对象中的任何数据。

我建议循环遍历该列,并使用df[col].isnull().sum() / df.shape[0] * 100返回#null除以总行,然后以格式化字符串打印输出,如下所示:

d = {'Col1': [np.nan, 6, np.nan, 2, np.nan],
'Col2': [np.nan, 3, 5, np.nan, 9],
'Col3': [2, 1, 8, np.nan, 9]}
df = pd.DataFrame(d)
for col in df.columns:
print(col, f'{df[col].isnull().sum() / df.shape[0] * 100} % NULL')
Col1 60.0 % NULL
Col2 40.0 % NULL
Col3 20.0 % NULL

最新更新