我想统计'?
为"成人"数据框中所有变量的值。dataset.workclass[dataset.workclass == '?'].count()
给出'workclass'列出现的次数。
但是,当我这样做时:
for column in dataset:
dataset.column[dataset.column == '?'].count()
给出错误:
'DataFrame' object has no attribute 'column'
count '?数据框架中所有变量的值。您可以只比较和求和整个数据框,不需要单独计算每个列:
(dataset == '?').sum().sum()
示例:
dataset = pd.DataFrame({'A': ['x', '?'], 'B': ['?', 'y']})
dataset
A B
0 x ?
1 ? y
(dataset == '?').sum().sum()
2