我有两个稀疏的 scipy 矩阵,title and paragraph
它们的维度分别为 (284,183)
和 (284,4195)
。两个矩阵的每一行都是来自我的数据集的一个实例的特征。我希望在没有预定义数量的聚类的情况下对这些聚类进行聚类,然后绘制它们。
我还有一个数组,Y
与每一行相关。 (284,1)
.一个类由 0 表示,另一个类由 1 表示。我想用这个给点上色。我如何使用 Python 来做到这一点?
您可以使用skikit-learn亲和力传播或均值偏移库进行聚类。这些算法将输出许多集群和中心。使用Y
似乎是一个不同的问题,因为除非您导入一些其他库,否则您无法在 3D 平面上绘制多维点。