无法在SVM模型中使用DateTime数据



我有一个dataframe来预测能耗。列。是TimestampDaily KWH system

在SVM模型中使用时,我将获得Value error如下: ValueError: Unknown label type: array([ 0. , 127.2264855 , 80.74373643, ..., 7.67569729, 3.32998307, 2.08538807])

数据集由从9月至12月开始每半小时每半小时组成。这是一个示例数据集

           Timestamp                 Daily_KWH_System
0        2016-09-07  19:47:07        148.978580
1        2016-09-07  19:47:07        104.084760
2        2016-09-07  19:47:07        111.850947
3        2016-09-07  19:47:07          8.421390
4        2016-12-15  02:48:07         13.778317
5        2016-12-15  02:48:07          0.637790

到目前为止,我已经完成了:

阅读CSV

 data = pd.read_csv('C:/Users/anagha/Documents/Python Scripts/Half_Ho.csv')

索引

 data['Timestamp'] = pd.to_datetime(data['Timestamp'])
 data.index = data['Timestamp']
 del data['Timestamp']
 data

绘制图形

 data.resample('D', how='mean').plot()

分开火车和测试

 from sklearn.utils import shuffle
 test  = shuffle(test)
 train = shuffle(train)
 trainData  = train.drop('Daily_KWH_System' , axis=1).values
 trainLabel = train.Daily_KWH_System.values
 testData  = test.drop('Daily_KWH_System' , axis=1).values
 testLabel = test.Daily_KWH_System.values

SVM模型

  from sklearn import svm
  model = svm.SVC(kernel='linear', gamma=1) 
  model.fit(trainData,trainLabel)
  model.score(trainData,trainLabel)

预测输出

   predicted= model.predict(testData)
   print(predicted)

SVC是支持向量分类。使用它会明确处理您的标签。看来您实际上是在尝试进行回归。(请注意您的错误,"未知标签类型")。一个好的第一步是检查SVR。或者,您可以将您的价值观纳入课程,例如0-10、10-20等:

Sklearn Svr

相关内容

  • 没有找到相关文章

最新更新