我想使用一个基于元素列表的目标函数,每个元素都是在数据帧(df)上应用函数的结果(比如说,函数是df观测值"测度"的方差)。也就是说,我有一个dfs列表。我自然想在dfs列表上sapply
我的函数。
如果没有sapply
,第一个块就可以工作它用于单个df,因此没有sapply命令,其中函数为min.RSS(标准误差的计算,我们希望optim
将其最小化)
#setup dfs
list_dat <- array(list(), dim=c(2,1))
list_dat[[1]] =data.frame(x=c(1,2,3,4,5,6,7,8),
y=c(1,3,5,6,8,12,15,19))
list_dat[[2]] =data.frame(x=c(1,2,3,4,5,6),
y=c(1,3,5,6,8,12))
#define objective fn
min.RSS <- function(data, par) {
with(data, sum((par[1] + par[2] * x - y)^2))
}
#optimize : find minimum given starting values, feeding in the first element, namely the df
result <- optim(c(0.5,0.5), min.RSS, data = list_dat[[1]])
以下不起作用,一个包含sapply
的块,返回错误
eval(expr、envir、enclos)中出错:找不到对象"x"
有人能解释一下原因吗
#define new objective function based only on the first element, and optimize
min.RSS <- function(data, par) {
sapply(list, function(data) with(data, sum((par[1] + par[2]* x - y)^2)))[[1]]
}
result <- optim(c(0.5,0.5), min.RSS, data = list_dat) # optimize, feeding in the list of (2) dfs
为了解释我不理解的地方,只需在没有optim
的情况下使用sapply即可实现预期效果。我将正在优化的参数par[1]
par[2]
更改为标量。也就是说,以下也适用
list2 <- sapply(list_dat, function(data) with(data, sum((1 + 2 * x - y)^2)))
list_dat
不是一个列表,它是一个列表数组- 您对
min.RSS
的定义将data
定义为其自变量,但随后引用list
# You don't really need to preallocate the list, but if you insist
list_dat <- vector(length=2, mode='list')
list_dat[[1]] =data.frame(x=c(1,2,3,4,5,6,7,8),
y=c(1,3,5,6,8,12,15,19))
list_dat[[2]] =data.frame(x=c(1,2,3,4,5,6),
y=c(1,3,5,6,8,12))
min.RSS <- function(list, par) {
sapply(list, function(data) with(data, sum((par[1] + par[2]* x - y)^2)))[[1]]
}
result <- optim(c(0.5,0.5), min.RSS, list = list_dat)