创建模型后的评估结果与BigQuery ML中使用ML.EEvaluate进行评估相比有什么区别



我正在尝试使用BigQuery ML训练一个模型,但对功能有点困惑。

当我使用CREATE MODEL函数创建模型时,它允许我将数据划分为训练和评估。假设我使用AUTO_SPLIT,我的行数在500到50000之间,根据文档,20%的数据被用作随机分割中的评估。我可以假设剩下的80%将用于训练吗?

因此,在某种程度上,通过使用CREATEMODEL函数,我基本上是在同时进行训练和评估。这种理解正确吗?如果是,那么ML.Evaluate函数的目的是什么?

CREATE MODEL语句在指定的数据集中训练一个新模型。其选项之一是设置DATA_SPLIT_METHOD,该方法根据拆分方法将输入数据拆分为两个不同的集合(训练评估(。评估数据用于避免通过提前停止进行过拟合,不会用于训练模型。评估集通常被称为验证集。

另一方面,ML.EVALUATE函数用于使用适用于所提供模型类型的通用度量来评估模型度量。它用于量化模型的性能。

ML。EVALUATE可用于根据训练模型时不可用的新数据来测试模型。

如果只使用模型调用ML.EVALUATE,而没有要评估的数据表,它将返回训练期间计算的评估。

最新更新