带有浮子和整数的阵列的随机森林评估-Numpy



我有一个数组,其中包含特征值作为浮子,并且我有一个标签,即整数-1和0。

示例:特征值:

[[  17.99    10.38   122.8   ...,    0.147    0.242    0.079]
 [  20.57    17.77   132.9   ...,    0.07     0.181    0.057]]

当我将标签附加到特征值数组时,标签会变成浮子。示例 - 附加的feature_values 0:

[[  17.99    10.38   122.8   ...,    0.242    0.079    0.   ]]

运行以下代码时:

training_set = data_features[:,0:9] 
test_set = data_features[:,9] 
seed = 7
num_trees = 100
max_features = 3
kfold = model_selection.KFold(n_splits=10, random_state=seed)
model = RandomForestClassifier(n_estimators=num_trees, max_features=max_features)
results = model_selection.cross_val_score(model, training_set, test_set, cv=kfold)
print(results.mean())

我有一个错误:

raise ValueError("Unknown label type: %r" % y_type)
ValueError: Unknown label type: 'continuous'

从我阅读的内容中,我看到这是因为标签是浮标而发生的。

如果将特征值的dtype更改为" int",则代码确实可以使用,但是我需要保留浮子。

是否有任何方法可以将标签作为整数和特征值作为浮子,以使代码有效?

您需要将y_labels转换为整数,以便RandomForestClassifier可以在其上训练。

test_set = data_features[:,9].astype(int)

最新更新