我试图从导入pandas的非结构化excel文件中剥离空单元格。我成功地删除了nan单元格使用这个lambda我发现df2.apply(lambda x: pd.Series(x.dropna().values))
它工作,但它会自动移动有数据的单元格。这是一个问题,因为我正在处理的数据是一个问题和答案列表,所以它们需要放在一起。
我正在寻找一种方法来重新索引数据后,它已被剥离,我认为这可能是通过合并数据本身使用pd的副本。合并,但无法解决。
谢谢。
如果我理解正确,你不需要空答案的问题,你可以只是删除整个行,然后重置索引。
df2 = df2.dropna().reset_index(drop=True)