在GBM模型中,使用以下参数 -
- col_sample_rate
- col_sample_rate_per_tree
- col_sample_rate_change_per_level
我了解采样的工作原理以及考虑在每个树的每个级别上分配多少变量。我试图了解每个功能都会考虑做出决定的次数。有没有办法轻松提取用于从模型对象做出拆分决定的所有功能样本?
指H2O,http://docs.h2o.ai/h2o/h2o/latest-stable/h2o-docs/data-science/algo-params/col_sample_rate.html,有一种了解60 60的方式,每次分开的随机选择?
谢谢您的帮助!
如果您想查看给定树中的给定拆分中使用了哪些功能,则可以导航H2otree对象。
对于R,请参见此处和此处的文档
python请参阅此处的文档
您还可以查看此博客(如果此链接死亡,请搜索H2otree类)
我不知道我是否会简单地称呼它,但是Mojo Tree Visualizer吐出了一个变成可视化的GraphViz点数据文件。这具有您感兴趣的信息。
http://docs.h2o.ai/h2o/latest-stable/h2o-genmodel/javadoc/overview-summary.html#viewing-a-mojo