基于、条件对数据帧值进行聚类


Name   Age   Status
Xenon    3    Bot
Carrie   16   Human
Argon    6    Bot
Carol    7    Human
Neon     5    Human

我想根据状态对它们进行聚类,如果它的Bot然后聚类1,如果Human然后聚类2,然后可视化它

Expected Output:
-   Name   Age   Status   Bocluster
Xenon    3    Bot      Cluster 1
Carrie   16   Human    Cluster 2
Argon    6    Bot      Cluster 1
Carol    7    Human    Cluster 2
Neon     5    Human    Cluster 2

我怎样才能做到这一点?我试着用K表示,但我不确定这是否是正确的方法。非常感谢您的帮助谢谢

您不需要集群算法。

cluster_decision = (df["Status"] == "Human").astype(int)
cluster_col = cluster_decision.map(lambda clus: "Cluster " + str(clus+1))

首先,Status用于确定条目是否是作为布尔值的人,并将其转换为int。接下来,将列映射到您期望的更漂亮的表示形式。最后,您必须将此列添加到数据框架中(此处未显示(。

相关内容

  • 没有找到相关文章

最新更新