我正在尝试使用SK learn对时间序列标记的数据执行线性回归。我的数据格式是data=(timestamp,value,label)
分配给我的数据的标签为 0 或 1。我试图从SKLearn网站上遵循这个例子
我的问题:
1-示例中训练数据的标签在哪里?他们在diabetes_y_train吗?
2- 方法的返回值是什么 预测() ?在我的代码中,它返回一个n_samples数组作为 [0,1] 范围内的预测值。但是,我希望返回 0 或 1 的二进制值(没有中间值)
1 - 火车的标签diabetes_y_train
2 - 您正在使用回归函数,因此具有连续变量是正确的。如果你想要二进制输出,你不是在解决回归问题,而是一个分类问题,然后你可以设置一个阈值来离散预测或使用sklearn提供的分类器之一。
1 - 是
2 - 预测计算浮点数,因为该示例尝试预测浮点值而不是二进制值。因此,没有是/否答案,而是一个预测值,为了估计误差,计算
np.mean((regr.predict(diabetes_X_test) - diabetes_y_test) ** 2)