目标列应该在离群值和偏度管理之前或之后创建



我有一个困惑,是困扰我,假设我们有一个数据集,我们需要从数据集导出目标列

数据中也有一些异常值和偏度,我应该在异常值和偏度处理之前还是在

之后创建目标列

因此,在对异常值和偏度进行任何处理之前,应该创建目标列。看到目标变量与具有异常值/偏度的idv之间的关系,然后决定治疗方法,总是很好的。双变量分析将明确是否需要任何治疗

最新更新