如何阻止熊猫在读取.xlsx文件时将整数转换为小数?



我有一个.xlsx文件,我正在使用pd加载到一个数据框架中。read_excel方法。但是,当我这样做时,其中一列的格式似乎发生了变化,pandas添加了一个小数点。有谁知道为什么会发生这种情况以及如何阻止它?

.xlsx文件中的数据示例:

191001
191002
191003

数据框中相同数据的示例:

191001.0
191002.0
191003.0

相关列在Excel中使用"General"格式选项。

我尝试用以下方法删除小数点;然而,我得到了错误信息">pandas.errors。IntCastingNaNError:无法将非有限值(NA或inf)转换为整数"。

df.column1 = df.column1.astype(int)

任何帮助将不胜感激!

您的文件很可能在列中有无限和nan值。

你需要先删除它们

import numpy as np
df.replace([np.inf, -np.inf], np.nan, inplace=True)
df.fillna(0, inplace = True)
df.column1 = df.column1.astype(int)

最新更新