提升分类器产生正确的标签

我是一名计算机科学专业的学生；我正在独立学习算法课程。

在课程中，我看到了这个问题：

假设我们有一个元素集X={x1，…，xn}，每个元素都有一个标签L(i(∈{0,1}(想想x(i(作为图片，并且标签指示它是否是猫(。我们还有一套分类器H，以及给定X上任何分布D的算法A，输出H∈H使得

Pr(i～D([h(x(i((=L(i(]≥0.51

显示生成一组T=O(logn(分类器h的算法(1( ，h(T(∈h，这样这些T分类器中的多数投票产生了所有1≤i≤n的正确标签。

问题的照片

据我所知，这是一个与助推有关的问题。但我不清楚如何展示这个问题的算法。

我找到了一个算法，但我不知道它是否适合这个问题：

Algorithm 1 Boost(D, A)
Let T ← 4 log n/ E^2 for E < 0.01.
Initialize a copy of polynomial weights to run over w^t ∈ ∆n.
for t = 1 to T do
Let h^t = A(D, w^t)
Let L^t ∈ [0, 1]^m be such that L^t_i = 1[h^t(xi) = yi].
Pass L^t to the PW algorithm.
end for
Let pˆ =1/T(SIGMA^T_t=1 e_h^t )
Return fpˆ(x).

算法链接，第16页

老实说，我不知道该怎么解决这个问题。

我们可以将其视为一个双人零和游戏。Carol("分类器"玩家(选择一个分类器，Dave("数据"玩家(选择标记元素。如果分类器正确，Carol获胜元素，如果不正确，Dave获胜。

算法A意味着Carol可以赢得这场比赛至少51%的时间我们可以运行ε=0.005(0.5%(的算法ComputeEQ来找到卡罗尔的策略，她从O(logn(中随机一致地选择分类器，并赢得至少50.5%的时间，无论Dave的策略这意味着多数票对所有n都是正确的元素。

(这真的是一个问题https://cs.stackexchange.com.)

相关内容

最新更新

热门标签：