标签传播可以用于scikit-learn中的半监督回归任务吗?根据其API,答案是肯定的。http://scikit-learn.org/stable/modules/label_propagation.html
然而,当我试图运行以下代码时,我得到了错误消息。
from sklearn import datasets
from sklearn.semi_supervised import label_propagation
import numpy as np
rng=np.random.RandomState(0)
boston = datasets.load_boston()
X=boston.data
y=boston.target
y_30=np.copy(y)
y_30[rng.rand(len(y))<0.3]=-999
label_propagation.LabelSpreading().fit(X,y_30)
显示label_propagation.LabelSpreading().fit(X,y_30)行中出现"ValueError: Unknown label type: 'continuous'"。
我该如何解决这个问题?非常感谢。
看起来像文档中的错误,代码本身显然只是分类(BasePropagation类的.fit
调用的开始):
check_classification_targets(y)
# actual graph construction (implementations should override this)
graph_matrix = self._build_graph()
# label construction
# construct a categorical distribution for classification only
classes = np.unique(y)
classes = (classes[classes != -1])
理论上,你可以删除"check_classification_targets"调用并使用"类似回归的方法",但它不会是真正的回归,因为你永远不会"传播"任何在训练集中没有遇到的值,你将简单地将回归值视为类标识符。并且您将无法使用值"-1",因为它是"unlabeled"的代号…