我有一个很大的数据框。通常,当我有这样的数据框时,我会得到该数据框的摘要,其中我得到每列中有多少非 NaN 值和列名称的信息。但是,对于这个,我得到了一个更短的摘要:
<class 'pandas.core.frame.DataFrame'>
Index: 138289 entries, 1993-07-23 to 2012-11-26
Columns: 101 entries, AAT to ZZT
dtypes: object(101)
我想获得一个标准的摘要,其中包含有关每列的信息。
我正在使用 ipython 笔记本和熊猫 0.9.1 如果这与它有任何关系
不幸的是,DataFrame.info 被黑客入侵,除非列少于100列,否则不会显示完整的摘要(查看源代码)。我们将修复 0.10:
https://github.com/pydata/pandas/issues/2524
尝试使用 set_printoptions
设置数据帧中显示的最大行数:
pd.set_printoptions(max_columns=101)
这应该允许您查看(汇总的)数据帧中的所有列。
max_rows
和max_columns
控制默认情况下显示的数据帧对象的行数和列数。
当数据帧很大时,它不会显示在iPython笔记本中。我只是强迫它:
from IPython.display import HTML
HTML(df.head().to_html())
确保使用头部:)