对熊猫数据帧中的媒体进行分组和计数



这是我的任务:编写一个函数,接受数据帧作为输入,列的名称缺少值​​,以及分组列的列表,并通过用中值填充缺失值来返回数据帧

这是我尝试做的:

def fillnull(set,col):
val = {col:set[col].sum()/set[col].count()}
set.fillna(val)
return set
fillnull(titset,'Age')

我的问题是我的函数不起作用,我也不知道如何计算中值,以及如何通过这个函数分组以下是我的数据帧的照片和数据集的缺失值

数据帧

NaN值

检查此代码是否适用于

import pandas as pd
df = pd.DataFrame({
'processId': range(100, 900, 100),
'groupId': [1, 1, 2, 2, 3, 3, 4, 4],
'other': [1, 2, 3, None, 3, 4, None, 9]
})
print(df)
def fill_na(df, missing_value_col, grouping_col):
values = df.groupby(grouping_col)[missing_value_col].median()
df.set_index(grouping_col, inplace=True)
df[missing_value_col].fillna(values, inplace=True)
df.reset_index(grouping_col, inplace=True)

return df
fill_na(df, 'other', 'groupId')

最新更新