大查询线性回归参数



这两点在大查询中的实际含义是什么。我在第二节中得到了,也许,总基数实际上意味着没有功能。第1点呢?

  1. 如果训练特征的总基数大于10000,则使用batch_gradient_descent策略
  2. 如果存在过度拟合问题,即培训次数示例小于10x,其中x是总基数,使用CCD_ 2策略

基数是一个特性的可能值的数量。总和是所有特征的可能值的总和。

对于#2,这意味着您必须提供比所有功能的可能值之和至少多10倍的输入。这是为了确保每个基数都有足够的示例,从而防止过度拟合。

最新更新