这两点在大查询中的实际含义是什么。我在第二节中得到了,也许,总基数实际上意味着没有功能。第1点呢?
- 如果训练特征的总基数大于10000,则使用
batch_gradient_descent
策略 - 如果存在过度拟合问题,即培训次数示例小于10x,其中x是总基数,使用CCD_ 2策略
基数是一个特性的可能值的数量。总和是所有特征的可能值的总和。
对于#2,这意味着您必须提供比所有功能的可能值之和至少多10倍的输入。这是为了确保每个基数都有足够的示例,从而防止过度拟合。