如何在BigQuery ML上使用PCA模型进行分类



我已经在BiqQuery上创建了一个PCA模型,但我很难弄清楚如何使用它来解决我的分类问题。我可以使用ML.EVALUATE,但仅此而已。如何使用PCA模型来训练分类模型呢?

我尝试了不同的ML函数,如预测,混淆矩阵和ROC,但最后两个不起作用,因为我无法使用PCA数据训练分类模型。下面是我的代码

CREATE MODEL
`mydataset.mymodel`
OPTIONS
( MODEL_TYPE='PCA',
PCA_EXPLAINED_VARIANCE_RATIO=0.8 ) AS
SELECT
*
FROM
`mydataset.mytable`
SELECT * FROM
ML.EVALUATE (MODEL 'mydataset.mymodel',
( SELECT target FROM 'mydataset.mytable'))

在训练一个PCA模型后,可以使用ML.PREDICT(modelmydataset.mymodel, data)将原始数据转换为其嵌入空间(即主成分)。通过这种方式,实现了降维。你也可以切换keep_original_columns"参数传递您不想转换的附加特性。这是指向"keep_original_columns": https://cloud.google.com/bigquery-ml/docs/reference/standard-sql/bigqueryml-syntax-predict#keep_original_columns的链接

然后可以将这些转换后的数据用于bqml中的分类器模型,例如逻辑回归、增强树分类器、随机森林分类器等。

如果您有更多问题,请发邮件至bqml-feedback@google.com

相关内容

  • 没有找到相关文章

最新更新