非常基本的问题:
如何打印归属于任意一个集群的观测值?
data = pd.read_csv('my_file.csv')
X = data[['Var1','Var2','Var3']]
ms = MeanShift()
ms.fit(X)
labels = ms.labels_
cluster_centers = ms.cluster_centers_
我只是想看看任何一个集群的'Var1','Var2','Var3'的值。
听起来您想要查看数据集的预测。可以这样做:
y_pred = ms.predict(X)
你可以这样把这些链接到你的样本:
df['y_pred'] = y_pred
并根据需要过滤您的数据框架,例如查看集群1中的样本:
df[df.y_pred == 1]