我想从python导出决策树结构。因此,我考虑保存树的每个节点。在sklearn的Tree文档中,我发现两个属性capacity和node_counts非常相似。在我目前的用法中,它们总是一样的。但我想知道他们的主要区别是什么?
https://www.kite.com/python/docs/sklearn.tree.tree.Tree
来自您引用的文档:
- node_count-当前节点数
- capacity—在需要重新调整内部缓冲区大小之前,此树可以容纳的最大节点数
node_count始终<=容量
同时,树不希望过多地增加node_count以外的容量,因为未使用的内部缓冲区可能会消耗大量内存。
TLDR:在编写树导出器时,应该注意node_count,而不是容量。