决策树学习可以"semi-supervised"吗？

我有一个数据集，其中包括三种类型的变量：自然状态，人类决策，响应变量。我正在尝试使用决策树学习使用其他变量来预测响应变量。

我的心智模型是，人们正在观察自然状态并做出决定。因此，我非常喜欢让我的决策树从根据自然状态变量进行分区开始，然后根据人类决策变量进行分区。我宁愿不要只是在决策树模型中丢弃所有变量，然后看看会弹出什么。

该心智模型是否有效，如果是，我将如何使用 Azure ML 实现这样的东西？我什至不知道用什么合适的词来描述这个问题——这是"半监督"决策树学习吗？

这里没有"半监督"部分。半监督意味着部分数据缺少标签（响应变量），事实并非如此。你只是为决策树学习提出了一个非常奇怪的约束，以最终处理特征的子集。为了做这样的事情，你需要改变DT学习过程，或者最好是从头开始编码。DT是极其简单的算法，需要几百行代码，而你的修改是一个简单的if内部，它说"如果在根的路径上，我们还没有使用所有有意义的'自然'特征，不要研究'人类决策'"。因此，它非常直接，但我认为没有任何库实际上支持这种约束（因为它远非自然，尤其是对于 DT）。

相关内容

最新更新

热门标签：