如何解释监督式 ML 算法(例如,查找具有某些特征范围的子组)



对于某些ML情况,重要的是不仅要给出可靠的预测,还要解释这个预测。

如果我们谈论药物治疗效率预测,医生会很好奇地选择一些有好或坏反应的患者组。

例如:如果患者对治疗A有负面反应:1)体重高且有黑发;2)老年人和以前接受过治疗B的人;3)既有低体重,又以前接受过治疗C治疗

它看起来像分类中的聚类。

解决此任务的常用方法有哪些?

我会说它看起来像"分类数据的聚类"(1)"聚类数据的分类"(2)。

哪里:(1)将是:"分别做出消极反应的主要原因是什么?即对数据进行分类,然后对每个类运行聚类。然后,例如,您的结果将像"许多阴性患者聚集在一起,因为他们有黑头发"。

2)将是:"鉴于患者状况(高体重,老年等)治疗的结果(pos/neg)是什么?即按条件对数据进行聚类,然后对每个条件运行分类。结果就像"黑头发的人有40%的负面反应"

这取决于什么对你很重要,你可以把它看成有点像条件概率

最新更新