我是数据科学的新手,并尝试在iPython笔记本中使用python 2.7进行一些数据整理。我在第一个项目中遵循的教程要求我用 Y 或 N 替换所有 NaN 输入。但是我想考虑另一种方法,我可以首先查看特定列的所有具有 NaN 输入的行,以便我可以更好地利用 fillna((。
有没有代码可以让我提取这样的行?
我有 13 行(loan_id、性别、已婚、credit_history等(大多数行没有 NaN 值,我的兴趣在于credit_history。如何提取信用记录下具有 NaN 值的所有行?
我希望输出类似于:
loan_id gender married credit_history loan_status
1 M Y NaN Y
2 F Y NaN N
3 M Y NaN Y
4 M Y NaN N
5 F N NaN Y
你去吧
df_null = df[df["credit_history"].isnull()]
如果这不能解决您的问题,请告诉我。
这是一种方式:
df2 = df[pd.isnull(df['credit_history'])]
解释
-
pd.isnull
根据序列中的每个条目是否NaN
创建一个布尔序列。 - 然后,可以将其用作
df
的索引器。