我提取了一个pandas数据帧,其中每一行都可以属于24个集群中的一个。
date cluster tweet_id id
0 2021-05-09 15:08:48 15 1391409828233351168 0
1 2021-05-09 07:29:08 7 1391294148200837122 1
2 2021-05-09 07:29:05 7 1391294136830005248 2
3 2021-05-09 07:28:02 7 1391293869799743489 3
4 2021-05-09 07:27:10 7 1391293650836017155 4
.. ... ... ... ...
195 2021-05-07 04:08:05 4 1390518778191089666 195
196 2021-05-07 04:07:57 4 1390518742715600898 196
197 2021-05-07 04:07:10 4 1390518546321575936 197
198 2021-05-07 04:06:58 4 1390518497097261058 198
199 2021-05-07 04:06:16 4 1390518318617006083 199
如何根据数据所属的聚类对数据进行分组,以及如何绘制x轴(聚类(=[1,2,3…24]和y轴=id的散点图?我尝试了以下代码,但它错了:
y = df['id']
x = df['cluster']
df.plot.scatter(x=x, y=y)
plt.show()
如果有人能帮我就太好了。
谢谢
试试这个:
date.plot.scatter(x='cluster', y='id')
plt.show()
x和y参数是要绘制的列的名称。你通过了两个熊猫系列赛。