BigQueryML:随机森林分类



你好,stackoverflow社区!

我最近发现Bigquery ML不支持随机森林分类模型。为了克服这一点,我想我可能可以用sklearn包构建一个模型,然后在bigqueryml上使用相同的超参数。在这种情况下,在bigquery中使用增强树模型是最好的选择吗?

您可以使用BQML的增强树模型类型训练随机森林模型,参数如下

  1. 将BOOSTER_TYPE设置为GBTREE
  2. 将NUM_PARALLEL_TREE设置为大于1的某个数字
  3. 将MAX_ITERMATIONS设置为1
  4. 将LEARN_RATE设置为1
  5. 将{COLSAMPLE_BYTREE、COLSAMPLEBYLEVEL、COLSAMPE_BYNODE}中的一个设置为小于1

随机森林模型被添加到BQ ML中。

CREATE MODEL mydataset.model1
OPTIONS(MODEL_TYPE = 'RANDOM_FOREST_CLASSIFIER')
AS SELECT * FROM mydataset.mytable;

文档-https://cloud.google.com/bigquery-ml/docs/reference/standard-sql/bigqueryml-syntax-create-random-forest

最新更新