我有一个约150个样本的数据集,其中每个样本有11个输入和3个输出。我试图建立一个完整的回归模型,接受11个输入来训练,以预测3个输出。问题是样本太少,训练一个完整的模型几乎是不可能的。出于这个原因,我正在尝试回归,比如python sklearn中的线性回归。从我能找到的大多数回归模型要么支持一个输入来预测一个输出(在回归完成后),要么支持多个输入来预测一个输出。
问题:是否存在支持多个输入来预测多个输出的回归类型?或者也许任何回归类型可能更适合我的需要。
谢谢你的帮助!
您是否考虑过对每个因变量简单地执行单独的线性回归?
此外,您需要确定哪些输入在理论上是显著的(就解释输出中的变化而言),然后测试统计显著性以确定哪些应该保留在模型中。
此外,多重共线性测试以确定是否有统计相关且无意中影响输出的变量。然后,依次检验序列相关性(如果数据是时间序列)和异方差。
你所描述的方法"垃圾输入,垃圾输出";过度拟合的风险——因为你似乎没有筛选输入本身在预测输出时的相关性。