我想知道所有输入数据的结果标签



使用随机森林算法进行学习。我想将输入数据的结果附加到现有的输入数据,我该怎么做?在scikit-learn的情况下,它提供了模型评估标准,如准确性、精度、召回率和结果的f1分数,但我不确定是否有一个函数像keras那样返回预测结果的标签。我不知道从哪里开始写代码,所以我就问一个问题。

通常,在使用sklearn时,会出现这样的情况:

input_data = pd.read_csv("path/to/data")
features = ["area", "location", "rooms"]
y = input_data["Price"]
X = input_data[features]
train_X, val_X, train_y, val_y = train_test_split(X, y, random_state=1)
model = RandomForest()
model.fit(train_X, train_y)

现在你的模型已经训练好了。正如您提到的,您可以在验证集上使用sklearn从模型中获得不同的度量。从模型中获得输出标签意味着获得预测(推理):

output_label = model.predict(val_X)
#This is an nd array with the size of val_y
x = pd.DataFrame(val_X,columns=["input"])
x["output_label"] = output_label

或者你可以使用numpy。连接将标签直接附加到输入数据

最新更新