为什么会这样?我的数据看起来非常简单明了,它是一个 ints 的 1 列数据帧,但 .describe 只返回计数、唯一、顶部、频率......不是最大值、最小值和其他预期输出。
(注意.describe()功能在其他项目/数据集中是预期的)
熊猫似乎无法将您的数据识别为 int。
尝试明确执行此操作:
print(df.astype(int).describe())
尝试:
df.agg(['count', 'nunique', 'min', 'max'])
您可以在该列表中添加或删除不同的聚合函数。当我有相当多的专栏时,我个人喜欢转置它:
df.agg(['count', 'nunique', 'min', 'max']).transpose()
若要减少列子集上的聚合,请采用不同的方法。
通过包含单词:示例"ID"
df.filter(like='ID').agg(['count', 'nunique'])
按数据类型:
df.select_dtypes(include=['int']).agg(['count', 'nunique'])
df.select_dtypes(exclude=['float64']).agg(['count', 'nunique'])
尝试将特征更改为数值以返回所需的所有静态:
df1['age'] = pd.to_numeric(df1['age'], errors='coerce')