矩阵代数 - 值误差 - 计算置信区间



我正在尝试使用delta method来计算非线性回归模型的置信区间。我的标准误差是 5,3,3 的数组,但我认为标准误差应该是 5 个值,而不是矩阵。尝试从预测值中添加或减去standard_error数组时出现值错误。任何帮助将不胜感激。

df = pd.DataFrame({
'cumsum_days': [1,2,3,4,5],
'pred': [388.259631, 368.389649, 349.754534, 332.264306, 315.836485]})
cov = np.array([[2.67918945e+04, 2.62421460e+02, 9.08452505e+00],
[2.62421460e+02, 4.31869566e+00, 1.24995272e-01],
[9.08452505e+00, 1.24995272e-01, 3.90413410e-03]])
# estimate confidence interval for predicted probabilities
gradient = np.gradient(df['pred'], df['cumsum_days'])
std_errors = np.array([np.sqrt(np.dot(np.dot(g, cov), g)) for g in gradient])
c = 1.96 # multiplier for confidence interval
upper = np.maximum(0, np.minimum(1, (df['pred'] + std_errors * c)))
lower = np.maximum(0, np.minimum(1, (df['pred'] - std_errors * c)))

此处的值错误:

print(df['pred'] + std_errors)
ValueError: operands could not be broadcast together with shapes (5,) (5,3,3) 

这是一个形状问题,你的梯度是形状(5,(,你的cov是形状(3,3(,通过迭代梯度中的每个元素g,np.dot(g,cov(只需将cov矩阵的每个元素乘以一个数字g(1(,得到一个形状(3,3(并创建一个包含5个形状元素的列表(3,3(, 因此形状为(5,3,3(。

我不知道有关 delta 方法的详细信息,但在我看来,您应该通过删除第一个和最后一个值来拥有形状 (5,5( 的 cov 矩阵或形状 (3,( 的梯度,然后您就可以做std_error = np.sqrt(np.dot(np.dot(gradient, cov), gradient))

最新更新