我正在Python中使用H2O进行回归树的可视化。 https://github.com/h2oai/h2o-tutorials/blob/master/tutorials/display_tree_mojo/DisplayTreeMojoH2O.ipynb
上面的例子提供了一种使用PrintMOJO的方法。但是,输出数字不包括每个节点的样本大小(以及节点的平均值(。在SKLearn中,样本量和平均值包括在内,但我不知道如何将它们整合到H2O中。
这就是我正在寻找的:http://www.netinstructions.com/content/images/2015/07/decision-tree-visualized.png
知道吗?
我寻找了很多资源,但我不知道我应该使用哪个选项或变量来实现这一点。如果我切换到 R,这会让事情变得更容易吗?
如果您向 PrintMojo 树打印工具提供 "—detail" 参数,您将获得更多信息。
特别是,您将看到每个节点的权重,即传入节点的行权重的总和。 (每行的默认权重为 1.0,但您可以通过提供权重列逐行更改它。
PrintMojo的源代码在这里:
- https://github.com/h2oai/h2o-3/blob/master/h2o-genmodel/src/main/java/hex/genmodel/tools/PrintMojo.java