统计数据框架中所有变量的出现次数



我想统计'?

为"成人"数据框中所有变量的值。
dataset.workclass[dataset.workclass == '?'].count()

给出'workclass'列出现的次数。

但是,当我这样做时:

for column in dataset:
dataset.column[dataset.column == '?'].count()

给出错误:

'DataFrame' object has no attribute 'column'

count '?数据框架中所有变量的值。您可以只比较和求和整个数据框,不需要单独计算每个列:

(dataset == '?').sum().sum()

示例:

dataset = pd.DataFrame({'A': ['x', '?'], 'B': ['?', 'y']})
dataset
A  B
0  x  ?
1  ?  y
(dataset == '?').sum().sum()
2

最新更新