小贝子编程

是否可以在scikit-learn的决策树回归器中检索每个叶子中的火车行id

本文关键字：检索叶子 id 火车 scikit-learn 回归决策树是否 python scikit-learn decision-tree
更新时间 : 2023-08-27
英文 : Is it possible to retrieve the train rows id within each leaf in a DecisionTreeRegressor of scikit-learn?

目前，我可以检索我在训练样本上成长的每个节点的 ID，我的测试样本的每一行最有可能属于该节点：

tree.tree_.apply(np.array(X_test).astype(np.float32))其中X_test表示决策树的输入。

但是，对于我生长的树的每一片叶子，我想获取其中包含的训练样本的 ID。这样我就可以知道哪个训练样本与一个测试输入最相似。

我最终对我的训练样本使用了"apply"函数来获得它所属的leaf_id。

def get_nearest_points(self, tr, input_train):
  inside_leaves = {}
  tmp = tr.tree_.apply(np.array(input_train).astype(np.float32))
  leaves_list = set(tmp)
  for leaf in leaves_list:
    inside_leaves[leaf] = [idx for idx, elt in enumerate(tmp) if elt == leaf]
  return inside_leaves

inside_leaves现在是一个字典，其中包含每个leaf_id此叶中涉及的行的列表。

是否可以在scikit-learn的决策树回归器中检索每个叶子中的火车行id

相关内容

最新更新

热门标签：