我现在有一些数据,它可能包含空值
我想删除它的空值(整行或整列(
我该如何处理比较?
这是我的数据
https://reurl.cc/5lONv6
它将有一些空值在时间序列数据中
以下是我的代码
c=pd.read_csv('./in/historical_01A190.txt',error_bad_lines=False)
c.dropna(axis=0,how='any',inplace=True)
c.dropna(axis=1,how='any',inplace=True)
c.to_csv('./out/historical_01A190.txt',index=False)
但它不起作用
有人能帮我吗?
好吧,首先,您的数据不会保存为csv。它被保存为一个以制表符分隔的文件。
所以你需要使用pd.read_table 打开它
>>> c=pd.read_table('./data.txt',error_bad_lines=False,sep='t')
其次,数据中充满了nan——如果在行或列中使用dropna,那么最终只剩下一行或一列(日期(。但是,在文件上使用正确的开启器,dropna和to_csv函数就可以工作。
如果不给变量赋值,那么它只会创建一个不存储在内存中的视图。
c = c.dropna(axis=0,how='any',inplace=True)
c = c.dropna(axis=1,how='any',inplace=True)
c = c.to_csv('./out/historical_01A190.txt',index=False)
试试这个。