R 中的非线性最小二乘法,当数据是要估计的参数的函数时



我目前正在从 matlab 迁移到 R,并试图找出我想做的事情是否可行。

我想估计 R 中的非线性模型,其中观测值是美国各州。 问题在于,其中一个自变量是县的州级指数,使用要估计的参数计算,即模型如下所示:

log(Y_s) = log(phi) + log(f(theta, X_cs)) + u_s

其中Y_s是州级变量,X_cs是包含州内变量的县级观测值的向量,f() 返回为州计算的索引的标量值。

到目前为止,我已经尝试使用 R 的nls函数,同时在将数据传递给函数时对其进行转换。 从索引的详细信息中抽象出来,代码的更简单版本如下所示:

library(dplyr)
state <- c("AK", "AK", "CA", "CA", "MA", "MA", "NY", "NY")
Y <- c(3, 3, 5, 5, 6, 6, 4, 4)
X <- c(4, 5, 2, 3, 3, 5, 3, 7)
Sample <- data.frame(state, Y, X)
f <- function(data, theta) {
output <- data %>%
group_by(state) %>%
summarise(index = mean(X**theta),
Y = mean(Y))
}
model <- nls(Y ~ log(phi) + log(index),
data = f(Sample, theta),
start = list(phi = exp(3), theta = 1.052))

这将返回一个错误,告诉我梯度是奇异的。 我的猜测是因为 R 看不到参数theta应该如何在公式中使用。

有没有办法使用nls来做到这一点? 我知道我可以手动定义要最小化的标准函数,即log(Y_s) - log(phi) - log(f(theta, X_cs)),并使用最小化例程来估计参数值。 但是我想使用nls的后估计功能,例如为参数估计设置置信区间。 任何帮助非常感谢。

抱歉,我拒绝安装那个巨大的元包。因此,我使用基本 R:

state <- c("AK", "AK", "CA", "CA", "MA", "MA", "NY", "NY")
Y <- c(3, 3, 5, 5, 6, 6, 4, 4)
X <- c(4, 5, 2, 3, 3, 5, 3, 7)
Sample <- data.frame(state, Y, X)
f <- function(X, state, theta) {
ave(X, state, FUN = function(x) mean(x^theta))
}
model <- nls(Y ~ log(phi) + log(f(X, state, theta)),
data = Sample, weights = 1/ave(X, state, FUN = length),
start = list(phi = exp(3), theta = 1.052))
summary(model)
#Formula: Y ~ log(phi) + log(f(X, state, theta))
#
#Parameters:
#      Estimate Std. Error t value Pr(>|t|)
#phi   2336.867   4521.510   0.517    0.624
#theta   -2.647      1.632  -1.622    0.156
#
#Residual standard error: 0.7791 on 6 degrees of freedom
#
#Number of iterations to convergence: 11 
#Achieved convergence tolerance: 3.722e-06

最新更新