我第一次使用scikit-learn,并尝试创建一个kmeans集群。我认为我做得对。
我在数据帧df
中有一个日期时间索引和两列int。
kmeans = KMeans(n_clusters=2)
kmeans.fit(df.values)
然后我有另一组看起来相同的数据,我想预测它。所以我把df1
传递给kmeans.predict()
。
我需要为每个数据帧添加一些列来进行分类吗?我想我在健身中所做的一切都很好。
完成分类后,如何将其可视化到图形中?
感谢
在不查看数据的情况下,假设您希望得到的预测作为第二个数据(df2)帧中的一列,则可以使用.apply()函数并指定垂直轴来应用kn.product()。这将为您提供一个具有预测输出的附加列。
即
df2['predictions'] = df2['values'].apply(kmeans.predict)
以下是申请信息。http://pandas.pydata.org/pandas-docs/version/0.17.1/generated/pandas.DataFrame.apply.html
希望能有所帮助。如果你还需要什么,请告诉我。