Pandas .describe() 只返回 4 个关于 int 数据帧的统计数据(count、unique、top、f



为什么会这样?我的数据看起来非常简单明了,它是一个 ints 的 1 列数据帧,但 .describe 只返回计数、唯一、顶部、频率......不是最大值、最小值和其他预期输出。

注意.describe()功能在其他项目/数据集中是预期的)

熊猫似乎无法将您的数据识别为 int。

尝试明确执行此操作:

print(df.astype(int).describe())

尝试:

df.agg(['count', 'nunique', 'min', 'max'])

您可以在该列表中添加或删除不同的聚合函数。当我有相当多的专栏时,我个人喜欢转置它:

df.agg(['count', 'nunique', 'min', 'max']).transpose()

若要减少列子集上的聚合,请采用不同的方法。

  • 通过包含单词:示例"ID"

    df.filter(like='ID').agg(['count', 'nunique'])

  • 按数据类型:

    df.select_dtypes(include=['int']).agg(['count', 'nunique'])

    df.select_dtypes(exclude=['float64']).agg(['count', 'nunique'])

尝试将特征更改为数值以返回所需的所有静态:

df1['age'] = pd.to_numeric(df1['age'], errors='coerce')

最新更新