sklearn.tree.tree.tree中的容量和node_counts之间有什么区别



我想从python导出决策树结构。因此,我考虑保存树的每个节点。在sklearn的Tree文档中,我发现两个属性capacity和node_counts非常相似。在我目前的用法中,它们总是一样的。但我想知道他们的主要区别是什么?

https://www.kite.com/python/docs/sklearn.tree.tree.Tree

来自您引用的文档:

  • node_count-当前节点数
  • capacity—在需要重新调整内部缓冲区大小之前,此树可以容纳的最大节点数

node_count始终<=容量

同时,树不希望过多地增加node_count以外的容量,因为未使用的内部缓冲区可能会消耗大量内存。

TLDR:在编写树导出器时,应该注意node_count,而不是容量。

最新更新