如何使用scikit learn/pandas/python打印任何一个集群的样本/观察/行



非常基本的问题:

如何打印归属于任意一个集群的观测值?

data = pd.read_csv('my_file.csv')
X = data[['Var1','Var2','Var3']]
ms = MeanShift()
ms.fit(X)
labels = ms.labels_
cluster_centers = ms.cluster_centers_

我只是想看看任何一个集群的'Var1','Var2','Var3'的值。

听起来您想要查看数据集的预测。可以这样做:

y_pred = ms.predict(X)

你可以这样把这些链接到你的样本:

df['y_pred'] = y_pred

并根据需要过滤您的数据框架,例如查看集群1中的样本:

df[df.y_pred == 1]

最新更新