我有一个.xlsx文件,我正在使用pd加载到一个数据框架中。read_excel方法。但是,当我这样做时,其中一列的格式似乎发生了变化,pandas添加了一个小数点。有谁知道为什么会发生这种情况以及如何阻止它?
.xlsx文件中的数据示例:
191001
191002
191003
数据框中相同数据的示例:
191001.0
191002.0
191003.0
相关列在Excel中使用"General"格式选项。
我尝试用以下方法删除小数点;然而,我得到了错误信息">pandas.errors。IntCastingNaNError:无法将非有限值(NA或inf)转换为整数"。
df.column1 = df.column1.astype(int)
任何帮助将不胜感激!
您的文件很可能在列中有无限和nan值。
你需要先删除它们
import numpy as np
df.replace([np.inf, -np.inf], np.nan, inplace=True)
df.fillna(0, inplace = True)
df.column1 = df.column1.astype(int)