我尝试解决一个具有 3 个特征和 6 个类(标签)的问题。训练数据集为 700 行 * 3 列。要素值在 0-100 之间连续。我使用一对多方法,但我不知道为什么预测准确率这么小,只有 24%。谁能告诉我,请问?谢谢!这就是我进行预测的方式:
function p = predictOneVsAll(all_theta, X)
m = size(X, 1);
num_labels = size(all_theta, 1);
% You need to return the following variables correctly
p = zeros(size(X, 1), 1);
% Add ones to the X data matrix
X = [ones(m, 1) X];
[m, p] = max(sigmoid(X * all_theta'), [], 2);
end
和一对一
% You need to return the following variables correctly
all_theta = zeros(num_labels, n + 1);
% Add ones to the X data matrix
X = [ones(m, 1) X];
initial_theta = zeros(n+1, 1);
options = optimset('GradObj', 'on', 'MaxIter', 20);
for c = 1:num_labels,
[theta] = ...
fmincg (@(t)(lrCostFunction(t, X, (y == c), lambda)), ...
initial_theta, options);
all_theta(c,:) = theta';
end
在 predictOneVsAll 中,你不需要使用 sigmoid 函数。只有在计算成本时才需要它。所以正确的代码是,
[m, p] = max((X * all_theta'), [], 2);
在 OneVsAll 中,循环应该看起来像这样
for c = 1:num_labels
all_theta(c,:) = fmincg (@(t)(lrCostFunction(t, X, (y == c), lambda)), initial_theta, options);
endfor
最好在 Andrew 的 ML 课程讨论中提出这些问题。他们会更熟悉代码和问题。