在panda中使用read_csv时精度丢失

我在一个文本文件中有以下格式的文件，我正试图将其读取到pandas数据帧中。

895|2015-4-23|19|10000|LA|0.4677978806|0.4773469340|0.4089938425|0.8224291972|0.8652525793|0.6829942860|0.5139162227|

正如您所看到的，在输入文件中的浮点之后有10个整数。

df = pd.read_csv('mockup.txt',header=None,delimiter='|')

当我试图将其读取到数据帧中时，我没有得到最后4个整数

df[5].head()
0    0.467798
1    0.258165
2    0.860384
3    0.803388
4    0.249820
Name: 5, dtype: float64

如何获得输入文件中的完整精度？我有一些矩阵运算需要执行，所以我不能将其强制转换为字符串。

我发现我必须对dtype做点什么，但我不确定应该在哪里使用它。

这只是显示问题，请参阅文档：

#temporaly set display precision
with pd.option_context('display.precision', 10):
    print df
     0          1   2      3   4             5            6             7   
0  895  2015-4-23  19  10000  LA  0.4677978806  0.477346934  0.4089938425   
             8             9            10            11  12  
0  0.8224291972  0.8652525793  0.682994286  0.5139162227 NaN

编辑：（谢谢Mark Dickinson）：

Pandas使用了一个专用的十进制到二进制转换器，为了速度而牺牲了完美的精度。将float_precision='round_trip'传递给read_csv可以修复此问题。有关详细信息，请参阅文档。

相关内容

最新更新

热门标签：