我有一个从ftp导入的pandas数据框,为此我需要修剪并仅显示32列中有一个或多个空白单元格的行,因为这需要发回让我们的管理团队填写缺失的数据。
我能够使用isna()方法做到这一点然而,在其中一个栏目"管理人口"中;正确的值之一是字符串"NA"当然isna()对于包含"NA"的单元格也会读取TRUE我需要找到一种方法来阻止这种情况的发生,并保留字符串"NA"的实例。谢谢你的建议
我发现了这个问题,它不是isna(),而是read_csv的默认行为导致了这个问题。因此,我创建了一个列表来存储需要Pandas以NaN形式查看的值:
myNAValues = ['-1.#IND', '1.#QNAN', '1.#IND', '-1.#QNAN', '#N/A N/A',
'#N/A', 'N/A', 'n/a', '', '#NA', 'NULL', 'null', 'NaN', '-NaN', 'nan', '-nan', '']
然后修改read_csv,包括:keep_default_na=False, na_values=myNAValues
现在输出是我需要的