我的尝试:
# Compute the mean, median and variance for the variables sph, acous and dur. Compare their level of variability.
sad_mean = dat_songs[['spch', 'acous', 'dur']].mean()
sad_mode = dat_songs[['spch', 'acous', 'dur']].mode()
sad_median = dat_songs[['spch', 'acous', 'dur']].median()
sad_mmm = pd.DataFrame({'mean':sad_mean, 'median':sad_median, 'mode':sad_mode})
sad_mmm
输出
首先,中位数列完全不对,我也想知道如何解决这个问题。其次,我觉得我已经看到了一些更快或更短的方法,用pandas的一个简单函数来完成这个任务。
我的数据头供参考
试试,dat_songs.describe()
。描述性统计将出现在所有数值列中。
dat_songs[['spch', 'acous', 'dur']].describe()