根据选择的假设函数来预测决策边界



在第3周的Coursera的机器学习课程中,Andrew-ng讨论了关于决策界限的问题,并在1:00指出 -

hθ(x)≥0.5→y = 1

(假设的值大于或等于0.5)

hθ(x)< 0.5→y = 0

(假设的值小于0.5,假设将预测y = 0)

其中hθ(x)是θtx的sigmoid烟雾。

怀疑 -

如果是这种情况,则pr(y = 1)始终大于或等于0.5,因为仅当y = 1才能预测hθ(x)≥0.5,并且此hθ(x)被认为是在这里4:45在这里散布的Y = 1的概率。PR(y = 0)也是如此,当时可以预测Hθ(x)< 0.5,因此值始终小于0.5。

但事实并非如此,y = 0的概率和y = 1的概率应在0到1。

恐怕对正在建模的内容和/或因变量的概率是什么。

首先,我们正在谈论有条件概率P(y | x),而不是边缘P(y),第二:

h(x) = P(y=1|x) = 1-P(y=0|x)

没有声称"当h(y = 0 | x)的概率是当h(x)< 0.5"建模的概率,这是错误的。该模型同时提供两个数量,它可以预测p(y = 1 | x)= h(x)和同时(由于概率的基本属性)p(y = 0 | x)= 1-h(X)。这也是为什么我们拥有0.5个阈值的原因,因为预测课时是最可能的类是什么是最可能的类,并注意到:

P(y=1|x) > P(y=0|x) <-> h(x) > 1-h(x) <-> 2h(x) > 1 <-> h(x) > 0.5

并不意味着一个类别或另一个类的概率"总是大于0.5"或总是更小 - 只有一个概率,由H(x)建模,而0.5来自上述方程式以获取最终标签,不是其概率。

我认为当您说P类P(y = 1)的概率时,我们只计算给定数据点x的每个类概率,也计算出H(x)=0.5是指数据点在类中的同等机会,并以图形方式表示两类的直线分区。

最新更新