我有一堆逻辑回归模型,我想看看它们的聚类情况如何。 有效地制作一些模型来代表整个群体。
但是,许多模型没有相同的参数。 当并非所有模型都具有所有参数时,聚集在测试版上似乎很奇怪
我建议将每个解释变量的优势比对数进行聚类。 这样,没有某些回归量的模型就可以用0.0
填充空值(这可以通过pandas
轻松完成
假设您有以下形式的所有模型的列表:
models = [{'beta1': m1_b1, 'beta2': m1_b2}, {'beta1': m2_b1, 'beta3': m2_b3}]
上面的命名法是这样的,m1_b1
表示模型 1,beta 1。 您会注意到这两个测试版并不相同。
您可以将它们放入数据框中,如下所示:
df = pd.DataFrame(models).fillna(0.0)