pandas data.describe()将不打印,除非它是最后一个条目?



我在这里有一些澄清,并试图环顾四周,但无法确定这是否是原因。

stats_df似乎只在最后运行时才打印。describe(data.describe())总是最后运行吗?

我在jupyter笔记本上做这个

import pandas as pd
data = pd.read_csv('data.csv')
stats_df = data.describe()
stats_df.loc['range'] = stats_df.loc['max'] - stats_df.loc['min']
//will not print
stats_df

out_fields = ['mean','25%','50%', '75%', 'range']
stats_df = stats_df.loc[out_fields]
stats_df.rename({'50%':'median'}, inplace=True)
//will print
stats_df

在jupyter-notebook中,如果不是None,您将看到最后一条语句的输出,作为单元格计算的结果。它存储在字典Out中,因此您可以重用它。但它不是印刷的纯粹含义。您可以在单元格中代码的最后使用分号;来抑制这一点。这有助于避免在Out中保存数据以及在删除数据时产生更多麻烦。要打印当前单元格下方的内容,请使用display,print,pprint或其他类似功能。

numpypandas等中的一些方法。在标准输出上显示信息,例如numpy.infopandas.DataFrame.info。其他返回描述性信息而不打印,例如pd.DataFrame.describe返回信息作为数据帧,但它打印任何内容。因此,您必须使用其他函数将其输出打印到显示器上。在您的情况下,我会使用display(stats_df)

相关内容

  • 没有找到相关文章

最新更新