你好,stackoverflow社区!
我最近发现Bigquery ML不支持随机森林分类模型。为了克服这一点,我想我可能可以用sklearn包构建一个模型,然后在bigqueryml上使用相同的超参数。在这种情况下,在bigquery中使用增强树模型是最好的选择吗?
您可以使用BQML的增强树模型类型训练随机森林模型,参数如下
- 将BOOSTER_TYPE设置为GBTREE
- 将NUM_PARALLEL_TREE设置为大于1的某个数字
- 将MAX_ITERMATIONS设置为1
- 将LEARN_RATE设置为1
- 将{COLSAMPLE_BYTREE、COLSAMPLEBYLEVEL、COLSAMPE_BYNODE}中的一个设置为小于1
随机森林模型被添加到BQ ML中。
CREATE MODEL mydataset.model1
OPTIONS(MODEL_TYPE = 'RANDOM_FOREST_CLASSIFIER')
AS SELECT * FROM mydataset.mytable;
文档-https://cloud.google.com/bigquery-ml/docs/reference/standard-sql/bigqueryml-syntax-create-random-forest