在向聚类模型提供训练数据集之前,我使用StandardScaler对数据进行转换。
X = StandardScaler().fit_transform(X_train)
假设,clf是无监督聚类模型,我预测标签如下:
y = clf.predict(X)
问题:我如何组合"y"one_answers"X_train"numpy数组?我不确定StandardScaler()是否维持矩阵内的顺序。那么,这能行吗?
df = pd.DataFrame(np.array(X_train), np.array(y))
是的,所有scikit-learn变压器都保持样品的顺序。