如何解释监督式 ML 算法(例如，查找具有某些特征范围的子组)

对于某些ML情况，重要的是不仅要给出可靠的预测，还要解释这个预测。

如果我们谈论药物治疗效率预测，医生会很好奇地选择一些有好或坏反应的患者组。

例如：如果患者对治疗A有负面反应：1）体重高且有黑发;2）老年人和以前接受过治疗B的人;3）既有低体重，又以前接受过治疗C治疗

它看起来像分类中的聚类。

解决此任务的常用方法有哪些？

我会说它看起来像"分类数据的聚类"（1）或"聚类数据的分类"（2）。

哪里：（1）将是："分别做出消极反应的主要原因是什么？即对数据进行分类，然后对每个类运行聚类。然后，例如，您的结果将像"许多阴性患者聚集在一起，因为他们有黑头发"。

（

2）将是："鉴于患者状况（高体重，老年等）治疗的结果（pos/neg）是什么？即按条件对数据进行聚类，然后对每个条件运行分类。结果就像"黑头发的人有40%的负面反应"

这取决于什么对你很重要，你可以把它看成有点像条件概率

相关内容