我是机器学习的新手,我需要关于什么样的分类算法和技术可以用来处理分类问题的高维数据集(129行和1900列(的建议。
算法将与任何其他分类保持相同,但您可以尝试以下操作:
-
使用PCA进行降维以降维
-
使用前向或后向选择算法
-
删除高度相关的变量
-
使用高阿尔法值的L1正则化,因为它本质上是的特征选择