循环访问大型数据集 R-Studio 的每一行



>假设我有一个包含给定邮政编码的 1500000 个州的列表,我想在该列表上运行我的预测器模型 (databas( 并获得 Area 的预测,我在一位绅士的帮助下做了同样的事情,这是我的代码:

pred <- sapply(1:nrow(first), function(row) { predict(basdata,first[row, ],estimator="BMA", interval = "predict", se.fit=TRUE)$Ybma })
  1. 基础数据:我的模型
  2. first:我正在预测该区域的新数据集。

现在,我面临的问题是代码需要很长时间来预测值。它遍历每一行并计算面积。我的数据集中有 150000 行,我会询问是否有人可以帮助我优化此代码的性能。

我要感谢onyambu为我提供了解决方案,因为我只是使预测函数更加复杂。以下代码可用于循环访问数据集的每一行,并使用生成的模型预测值。

predict(basdata,first,estimator="BMA", interval = "predict", se.fit=TRUE)$Ybma

最新更新