>我正在治疗乳腺癌数据集的原始数据集(分类( 在许多网站上,我发现他们这样做的可视化:
属性 1 的 X 轴 用于归因的 Y 轴2
它们只有两个属性,如输入和类属性 = (0,1( 他们还在该可视化上绘制假设图 就我而言,我有 9 个属性
我该怎么做? 我选择任意两个属性还是什么?
它更像是数据的呈现。
人类的思维不可能处理超过3个维度。因此,即使你以某种方式可视化了9个维度,你也无法从中推断出任何东西。 我宁愿建议你一次取2或3个特征,并可视化多个图。话虽如此,有些地块还可以容纳 3 个以上的功能。 试试这个链接。
这个 kaggle 内核使用相同的乳腺癌数据集,并对可视化有一些有趣的见解。