数据有>400 行,这是一个示例:
TIME PERSON
0 22.222222 Runner
1 23.796791 Cyclist
2 20.789474 Swimmer
3 21.270718 Pedestrain
4 19.518717 Kid
时间是类型:浮点 人是类型:对象
import matplotlib.pyplot as plt
import seaborn as sns
%matplotlib inline
raw_data = pd.DataFrame({"PERSON": ['PERSON']})
plt.figure(figsize=(16, 10))
raw_data.plot(kind='barh', x=raw_data['TIME'], y="PERSON")
plt.xlabel("TIME")
plt.ylabel("PERSON")
plt.show()
不确定如何对"PERSON"进行分类,因为它有多种不同的类型,我必须一一命名吗?我想在"PERSON"中对值进行分组,并显示"TIME"的平均值。提前非常感谢
您可以使用 seaborn 库,它已包含在代码中。它被开发为"从盒子里"做这样的图表:
plt.figure(figsize=(16, 10))
sns.barplot(x='TIME', y='PERSON', data=raw_data)
对于按人员分组和按时间平均,答案很简单:
sns.barplot(x='TIME', y='PERSON', data=raw_data.groupby('PERSON').mean().reset_index())