决策树学习可以"semi-supervised"吗?



我有一个数据集,其中包括三种类型的变量:自然状态,人类决策,响应变量。我正在尝试使用决策树学习使用其他变量来预测响应变量。

我的心智模型是,人们正在观察自然状态并做出决定。因此,我非常喜欢让我的决策树从根据自然状态变量进行分区开始,然后根据人类决策变量进行分区。我宁愿不要只是在决策树模型中丢弃所有变量,然后看看会弹出什么。

该心智模型是否有效,如果是,我将如何使用 Azure ML 实现这样的东西?我什至不知道用什么合适的词来描述这个问题——这是"半监督"决策树学习吗?

这里没有"半监督"部分。 半监督意味着部分数据缺少标签(响应变量),事实并非如此。 你只是为决策树学习提出了一个非常奇怪的约束,以最终处理特征的子集。为了做这样的事情,你需要改变DT学习过程,或者最好是从头开始编码。DT是极其简单的算法,需要几百行代码,而你的修改是一个简单的if内部,它说"如果在根的路径上,我们还没有使用所有有意义的'自然'特征,不要研究'人类决策'"。因此,它非常直接,但我认为没有任何库实际上支持这种约束(因为它远非自然,尤其是对于 DT)。