使用excel工作表而不是带有panda的csv有什么缺点



我正在为一个"记事本"程序制作自己的简单电子表格。基本上,我有一个excel电子表格,有两列:问题,答案。这个想法是程序提出问题,你给出答案,然后检查你是否正确。就像你用手写笔记卡一样。

我正在excel中创建笔记卡数据集,为了保持excel格式,我一直在保存扩展名为xlsx的文件。现在,我正在这样写代码:

pd.read_excel("filename.xlsx")

这种方法的缺点是什么?我注意到csv和xlsx之间存在极端的文件大小差异,但这在小型数据集中重要吗?熊猫阅读excel电子表格的速度明显变慢了吗?

我已经习惯了数据分析中的CSV,所以使用xlsx感觉不对。这不是问题吗?

除了文件大小之外,读取excel文件也比csv慢,因为它保存了数据格式。然而,如果数据集很小,这可能是一个微不足道的因素。

主要的问题是,你应该问,你的系统是否需要excel数据格式?如果使用csv是一种选择,你应该始终使用它。

最新更新