我希望将csv读入数据框:
例如
name, age, city
Dave, , London
Bob, 24, Melbourne
Joe, 38, Boston
我希望保留没有列出年龄的行。
如果我将空的 csv 值读取到数据帧中,我可以过滤 NaN 是df[‘age’].isnull()
如果我将空 csv 值作为空字符串读取到数据框中,我可以按df[‘age’]!=“”
我已经研究了空和NaN之间的区别。但对我来说仍然不明显的是使用每种方法的含义/优点/缺点是什么,或者它们只是两种方法来实现相同的结果?
我脑海中最大的区别是数据帧如何处理每个值。如果以NaN
方式读入,则可以使用isna()
和df.info
等内置方法来查找 null 值,如果您只是使用空字符串初始化,则不一定