Python logit 回归矩阵形状错误"ValueError: endog and exog matrices are different sizes"



基本设置:我试图在python中对创业概率(创始人变量(进行logit回归,外生变量是年份、年龄、教育类别和性别。

X矩阵是(4560(,y矩阵是(1650(。x矩阵中的所有变量都有650个非NaN观测值。

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import statsmodels.api as sm
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import classification_report, confusion_matrix
x=np.array ([ df_all['Year'], df_all['Age'], df_all['Edu_cat'], df_all['sex']])
y= np.array([df_all['founder']])
logit_model = sm.Logit(y, x)
result = logit_model.fit()
print(result)

所以我在追踪这个形状是好的,但python告诉我的不是这样。我是不是错过了一些基本的东西?

我认为问题出在Y数组[650,1]上,而它应该是[650,],这是默认值。此外,我需要通过转置使x数组[650,4]。

最新更新