SVM 决策边界绘图中的错误

我试图模仿我在 Kaggle 上找到的关于绘制 SVM 决策边界的代码。我正在使用自己的数据集，其中包含 608 个数据和 10 个特征，有 2 个类。例如，这两个类是你是否是diabetec。我在此链接上复制了代码的 SVM 部分(当您在底部向下滚动时，您可以在其中找到它(其中提到了决策边界可视化。这是我参考的链接。

但是，我收到此错误，说"X 必须是 Numpy 数组"。有人可以向我解释这是什么意思吗？

下面的代码是我所做的。请注意，我的数据集已经事先进行了规范化。此外，我将数据拆分为 70：30 的比例。

import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
import matplotlib.pyplot as show
import matplotlib as cm
import matplotlib.colors as colors
from sklearn.model_selection import train_test_split
from sklearn.svm import SVC
from sklearn import svm
from mlxtend.plotting import plot_decision_regions

autism = pd.read_csv('diabetec.csv')
x = autism.drop(['TARGET'], axis = 1)  
y = autism['TARGET']
x_train, X_test, y_train, y_test = train_test_split(x, y, test_size = 0.30, random_state=1)
t = np.array(y_train)
t = t.astype(np.integer)
clf_svm = SVC(C=1.3, gamma=0.8, kernel='rbf')
clf_svm.fit(x_train, t)
plt.figure(figsize=[15,10])
plot_decision_regions(x_train, t, clf = clf_svm, hide_spines = False, colors = 'purple,limegreen', markers = ['x','o'])
plt.title('Support Vector Machine')

plot_decision_regions需要一个numpy数组，但x_train是一个熊猫数据帧。尝试使用x_train.values，即

plot_decision_regions(x_train.values, t, clf = clf_svm, ...

相关内容

最新更新

热门标签：