如何找到分类数据列的模式



我想找到一列分类数据中最重复的值(这是模式(,并用这个值填充空白单元格。

"Embarked";列只有三个值:S、Q、C

当我试图计算平均值和中值时,它已经给出了一个错误,因为它没有数值,但我可以采用这列的模式,当我尝试这部分代码时,它不会给出错误:

embarked=df_missing['Embarked']
df_missing['Embarked']=df_missing['Embarked'].fillna(embarked.mode())

但它也不会填充空单元格。我怎样才能找到这个专栏的模式。

这应该有效,但请尝试这种方法。

首先尝试df_missing['Embarked'].value_counts(),看看你是否得到了你所期望的。

然后尝试:

embarked_mode = df_missing['Embarked'].mode()
df_missing['Embarked'].fillna(embarked_mode, inplace=True)

如果你的列中不包含单元格实际上不是Na,那么正如@Quang Hoang所说,这可能是因为你有空字符串。在这种情况下,您可以尝试:

embarked_mode = df_missing['Embarked'].mode()
df_missing['Embarked'].replace('s+', embarked_mode, regex=True, inplace=True)

最新更新