我当前的项目有大量带有空值的列。从技术上讲,我可以填充它们或一个接一个地放置它们。但我想,也许我可以编写一个自动为我执行 fillna 的函数。这是我到目前为止提出的,
def fill_null(df, column):
if np.dtype(df[column]) == 'O':
df[column].fillna('NA', inplace = True)
elif np.dtype(df[column]) != 'O':
df[column].fillna(0, inplace = True)
return
它有效。但是有没有办法让它自动循环访问整个数据帧并自动填充它们?或者我要求太多了。我仍然是编程的新手,并不擅长迭代。
谢谢!
对对象列使用DataFrame.select_dtypes
并创建字典以替换为DataFrame.fillna
,然后将所有其他列替换为0
:
d = dict.fromkeys(df.select_dtypes(object).columns, 'NA')
df = df.fillna(d).fillna(0)
另一种解决方案:
df = df.apply(lambda x: x.fillna('NA') if x.dtype == 'O' else x.fillna(0))