提升分类器产生正确的标签



我是一名计算机科学专业的学生;我正在独立学习算法课程。

在课程中,我看到了这个问题:

假设我们有一个元素集X={x1,…,xn},每个元素都有一个标签L(i(∈{0,1}(想想x(i(作为图片,并且标签指示它是否是猫(。我们还有一套分类器H,以及给定X上任何分布D的算法A,输出H∈H使得

Pr(i~D([h(x(i((=L(i(]≥0.51

显示生成一组T=O(logn(分类器h的算法(1( ,h(T(∈h,这样这些T分类器中的多数投票产生了所有1≤i≤n的正确标签。

问题的照片

据我所知,这是一个与助推有关的问题。但我不清楚如何展示这个问题的算法。

我找到了一个算法,但我不知道它是否适合这个问题:

Algorithm 1 Boost(D, A)
Let T ← 4 log n/ E^2 for E < 0.01.
Initialize a copy of polynomial weights to run over w^t ∈ ∆n.
for t = 1 to T do
Let h^t = A(D, w^t)
Let L^t ∈ [0, 1]^m be such that L^t_i = 1[h^t(xi) = yi].
Pass L^t to the PW algorithm.
end for
Let pˆ =1/T(SIGMA^T_t=1 e_h^t )
Return fpˆ(x).

算法链接,第16页

老实说,我不知道该怎么解决这个问题。

我们可以将其视为一个双人零和游戏。Carol("分类器"玩家(选择一个分类器,Dave("数据"玩家(选择标记元素。如果分类器正确,Carol获胜元素,如果不正确,Dave获胜。

算法A意味着Carol可以赢得这场比赛至少51%的时间我们可以运行ε=0.005(0.5%(的算法ComputeEQ来找到卡罗尔的策略,她从O(logn(中随机一致地选择分类器,并赢得至少50.5%的时间,无论Dave的策略这意味着多数票对所有n都是正确的元素。

(这真的是一个问题https://cs.stackexchange.com.)

最新更新