!(https://i.stack.imgur.com/FX1vB.png)!(https://i.stack.imgur.com/mGajr.png)
大家好,
我对Python很陌生,所以请耐心等待。我相信这是一个简单的答案。
以上是我的散点图,包含Kaggle的GOLF数据。X变量为Fairway Hit%,Y变量为Average Driving Distance。我可以看出数据中存在轻微的负相关性。
每个红点都是一个玩家。我想根据玩家的年龄使每个点都有不同的颜色。在我的数据集中有一个完整的系列,名为"年龄",从21岁到49岁不等。例如,我希望20-29岁的球员是蓝点,30-39岁是红点,40-49岁是黄点。
我试图对此进行研究,但收效甚微,因为我试图像上面的第三张图一样编写代码。我试图将"AGE"的子系列定义为类似于"AGE’>=20<=29.
我运气不好,我相信这不会太难,所以任何帮助都将不胜感激。非常感谢。错误数据
我试着让每个点都有不同的颜色,以代表高尔夫球手的年龄。
import pandas as pd
df = pd.DataFrame({'Age': [18, 22, 26,36, 47,78]})
YOUNG = df[(df['Age']>=20) & (df['Age']<=29)]
YOUNG
或者如果Age
的类型是字符串,
import pandas as pd
df = pd.DataFrame({'Age': ['18', '22', '26', '36', '47', '78']})
df['Age'] = df['Age'].astype('int64')
YOUNG = df[(df['Age']>=20) & (df['Age']<=29)]
YOUNG