我正在阅读这个堆栈溢出,并有一个进一步的问题。一旦簇已经完成,是否有可能确定一个新句子将落入哪个簇?
在 Python 中使用 scikit-learn kmeans 对文本文档进行聚类
当然,只需使用 predict
方法即可。继续引用问题中的示例
X_new = vectorizer.transform([sentence])
y_new = model.predict(X_new)