我使用mallet中的maxent算法进行标签分类。我想知道是否有可能为maxent分类器预测的标签获得某种置信度值。我基本上需要的是分类器最有信心的前K个预测(不是针对每个令牌,而是来自整个数据)实例,并将它们用于引导。有办法吗?
查看调用任何木槌分类方法时返回的Labeling对象。该类包含每个标签的所有计算分数:最好的分数将成为答案(这是getBestLabel()方法返回的分数)。问题是这些分数通常不是概率。我不熟悉mallet的maxent分类器——您需要查看代码并确定返回的分数是否可以以某种方式"转换"为概率,或者是否已经以适当的形式存在。无论如何,听起来你想要做的是给前K分之间的相对差异赋予意义。同样,这取决于maxent分类器的确切细节。因此,查看标签对象实例实际返回到您的数据集中,并使用您的最佳判断。
希望这对你有帮助!