我在这里有一些澄清,并试图环顾四周,但无法确定这是否是原因。
stats_df似乎只在最后运行时才打印。describe(data.describe())总是最后运行吗?
我在jupyter笔记本上做这个
import pandas as pd
data = pd.read_csv('data.csv')
stats_df = data.describe()
stats_df.loc['range'] = stats_df.loc['max'] - stats_df.loc['min']
//will not print
stats_df
out_fields = ['mean','25%','50%', '75%', 'range']
stats_df = stats_df.loc[out_fields]
stats_df.rename({'50%':'median'}, inplace=True)
//will print
stats_df
在jupyter-notebook中,如果不是None
,您将看到最后一条语句的输出,作为单元格计算的结果。它存储在字典Out
中,因此您可以重用它。但它不是印刷的纯粹含义。您可以在单元格中代码的最后使用分号;
来抑制这一点。这有助于避免在Out
中保存数据以及在删除数据时产生更多麻烦。要打印当前单元格下方的内容,请使用display
,print
,pprint
或其他类似功能。
numpy、pandas、等中的一些方法。在标准输出上显示信息,例如numpy.info
和pandas.DataFrame.info
。其他返回描述性信息而不打印,例如pd.DataFrame.describe
返回信息作为数据帧,但它不打印任何内容。因此,您必须使用其他函数将其输出打印到显示器上。在您的情况下,我会使用display(stats_df)
。