我有一个dataframe
来预测能耗。列。是Timestamp
和Daily KWH system
。
在SVM模型中使用时,我将获得Value error
如下: ValueError: Unknown label type: array([ 0. , 127.2264855 , 80.74373643, ..., 7.67569729,
3.32998307, 2.08538807])
数据集由从9月至12月开始每半小时每半小时组成。这是一个示例数据集
Timestamp Daily_KWH_System
0 2016-09-07 19:47:07 148.978580
1 2016-09-07 19:47:07 104.084760
2 2016-09-07 19:47:07 111.850947
3 2016-09-07 19:47:07 8.421390
4 2016-12-15 02:48:07 13.778317
5 2016-12-15 02:48:07 0.637790
到目前为止,我已经完成了:
阅读CSV
data = pd.read_csv('C:/Users/anagha/Documents/Python Scripts/Half_Ho.csv')
索引
data['Timestamp'] = pd.to_datetime(data['Timestamp'])
data.index = data['Timestamp']
del data['Timestamp']
data
绘制图形
data.resample('D', how='mean').plot()
分开火车和测试
from sklearn.utils import shuffle
test = shuffle(test)
train = shuffle(train)
trainData = train.drop('Daily_KWH_System' , axis=1).values
trainLabel = train.Daily_KWH_System.values
testData = test.drop('Daily_KWH_System' , axis=1).values
testLabel = test.Daily_KWH_System.values
SVM模型
from sklearn import svm
model = svm.SVC(kernel='linear', gamma=1)
model.fit(trainData,trainLabel)
model.score(trainData,trainLabel)
预测输出
predicted= model.predict(testData)
print(predicted)
SVC
是支持向量分类。使用它会明确处理您的标签。看来您实际上是在尝试进行回归。(请注意您的错误,"未知标签类型")。一个好的第一步是检查SVR
。或者,您可以将您的价值观纳入课程,例如0-10、10-20等:
Sklearn Svr