预测
i有一个状态 -> action对的数据集,(s,a),每个s在可能的选择上定义了概率分布,每个a都是从该概率中取样的分配。我想训练该数据集的分类器,而不是学会预测最大可能性,而是从。
例如,如果您正在玩迭代的岩纸剪辑器,那么您的状态可能只是您做出的先前举动,而A∈{Rock,Paper,Scissors},以前的状态降低了选择该选择的可能性再次行动。然后,我的数据集将看起来像:
PreviousAction,Chosen
Rock,Paper
Paper,Rock
Rock,Scissors
Scissors,Paper
Paper,Paper
...
是否可以在Scikit-Learn中使用随机森林的标签上学习概率分布?
是的,是。使用fit
训练RandomForestClassifier
(期望标签,而不是概率分布,作为其y
参数),然后使用predict_proba
。