我正在尝试绘制高斯朴素贝叶斯分类器的决策曲面。不过,我似乎在训练分类器时遇到了一些问题。我对机器学习也很陌生。
首先,我生成 100 个随机点,其中一半具有不同的坐标和标签。
for i in range(50):
point1.append([np.random.randint(50,80),np.random.randint(50,80)])
point1L.append(1)
for i in range(50):
point2.append([np.random.randint(10,40),np.random.randint(10,70)])
point2L.append(0)
然后我训练它。
clf = GaussianNB()
clf.fit(point1,point1L)
clf.fit(point2, point2L)
然后我遇到了一个问题。我在这里的分类器似乎无法区分这两点。
print(clf.predict([np.random.randint(50,80),np.random.randint(50,80)]))
print(clf.predict([np.random.randint(10,40),np.random.randint(10,70)]))
我得到的结果似乎总是:
[0]
[0]
我做错了什么,我该如何解决?
附带说明一下,我还想知道我是否可以直接从分类器本身绘制决策边界,而不是通过比较分类器在每个点的决策。
fit()
方法只能调用一次。您正在调用fit
方法两次,一次用于point1
,一次用于point2
。所以当你再次调用fit()
进行point2
时,估计器会自行复位,只训练point2L
,即 0。这就是为什么您的预测始终为 0。首先将point1
和point2
组合成一个新矩阵(标签相同(,然后在新矩阵上调用 fit
方法。