SVM 决策边界绘图中的错误



我试图模仿我在 Kaggle 上找到的关于绘制 SVM 决策边界的代码。我正在使用自己的数据集,其中包含 608 个数据和 10 个特征,有 2 个类。例如,这两个类是你是否是diabetec。我在此链接上复制了代码的 SVM 部分(当您在底部向下滚动时,您可以在其中找到它(其中提到了决策边界可视化。这是我参考的链接。

但是,我收到此错误,说"X 必须是 Numpy 数组"。有人可以向我解释这是什么意思吗?

下面的代码是我所做的。请注意,我的数据集已经事先进行了规范化。此外,我将数据拆分为 70:30 的比例。

import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
import matplotlib.pyplot as show
import matplotlib as cm
import matplotlib.colors as colors
from sklearn.model_selection import train_test_split
from sklearn.svm import SVC
from sklearn import svm
from mlxtend.plotting import plot_decision_regions

autism = pd.read_csv('diabetec.csv')
x = autism.drop(['TARGET'], axis = 1)  
y = autism['TARGET']
x_train, X_test, y_train, y_test = train_test_split(x, y, test_size = 0.30, random_state=1)
t = np.array(y_train)
t = t.astype(np.integer)
clf_svm = SVC(C=1.3, gamma=0.8, kernel='rbf')
clf_svm.fit(x_train, t)
plt.figure(figsize=[15,10])
plot_decision_regions(x_train, t, clf = clf_svm, hide_spines = False, colors = 'purple,limegreen', markers = ['x','o'])
plt.title('Support Vector Machine')

plot_decision_regions需要一个numpy数组,但x_train是一个熊猫数据帧。尝试使用x_train.values,即

plot_decision_regions(x_train.values, t, clf = clf_svm, ...

最新更新