使用scikit学习进行聚类



我第一次使用scikit-learn,并尝试创建一个kmeans集群。我认为我做得对。

我在数据帧df中有一个日期时间索引和两列int。

kmeans = KMeans(n_clusters=2)
kmeans.fit(df.values)

然后我有另一组看起来相同的数据,我想预测它。所以我把df1传递给kmeans.predict()

我需要为每个数据帧添加一些列来进行分类吗?我想我在健身中所做的一切都很好。

完成分类后,如何将其可视化到图形中?

感谢

在不查看数据的情况下,假设您希望得到的预测作为第二个数据(df2)帧中的一列,则可以使用.apply()函数并指定垂直轴来应用kn.product()。这将为您提供一个具有预测输出的附加列。

df2['predictions'] = df2['values'].apply(kmeans.predict)

以下是申请信息。http://pandas.pydata.org/pandas-docs/version/0.17.1/generated/pandas.DataFrame.apply.html

希望能有所帮助。如果你还需要什么,请告诉我。

相关内容

  • 没有找到相关文章

最新更新