在熊猫中使用空与空的原因

我希望将csv读入数据框：

例如

name, age, city
Dave, , London
Bob, 24, Melbourne
Joe, 38, Boston

我希望保留没有列出年龄的行。

如果我将空的 csv 值读取到数据帧中，我可以过滤 NaN 是df[‘age’].isnull()

如果我将空 csv 值作为空字符串读取到数据框中，我可以按df[‘age’]!=“”

我已经研究了空和NaN之间的区别。但对我来说仍然不明显的是使用每种方法的含义/优点/缺点是什么，或者它们只是两种方法来实现相同的结果？

我脑海中最大的区别是数据帧如何处理每个值。如果以NaN方式读入，则可以使用isna()和df.info等内置方法来查找 null 值，如果您只是使用空字符串初始化，则不一定

相关内容