pandas数据帧的ram大小v.s.xlsx保存的大小



我有一个名为df的panda数据帧,我用得到了它的ram大小

sys.getsizeof(df)

它输出了828000字节,然后我将其保存到.xlsx文件中。

writer = pd.ExcelWriter('df.xlsx', engine='xlsxwriter')
df.to_excel(writer, sheet_name='Sheet1')
writer.save()

但是文件大小,即使它xlsx,我认为它更大(因为它具有excel文件功能(,但它与.csv不兼容,我不知道为什么(第二个问题(,无论如何,xlsx文件大小为352 KB。那为什么呢?为什么在ram中,它占用的大小大于保存的大小(主要问题(?难道不是相反吗?

XLSX是一个Zip文件。它被压缩了。因此,您通常可以期望它比类似的CSV、DataFrame或XLS(旧格式(文件更小。

最新更新