我正在使用R对SQL Server 2008 R2数据库进行统计分析。我的数据库客户端(又名驱动程序)是JDBC,因此我使用的是RJDBC包。
我的查询非常简单,我确信该查询会返回很多行(大约200万行)。
SELECT * FROM [maindb].[dbo].[users]
我的R脚本如下。
library(RJDBC);
javaPackageName <- "com.microsoft.sqlserver.jdbc.SQLServerDriver";
clientJarFile <- "/home/abforce/mystuff/sqljdbc_3.0/enu/sqljdbc4.jar";
driver <- JDBC(javaPackageName, clientJarFile);
conn <- dbConnect(driver, "jdbc:sqlserver://192.168.56.101", "username", "password");
query <- "SELECT * FROM [maindb].[dbo].[users]";
result <- dbSendQuery(conn, query);
dbHasCompleted(result)
在上面的代码中,最后一行总是返回TRUE
。这里可能出了什么问题?
函数dbHasCompleted
总是返回TRUE
这一事实似乎是一个已知的问题,因为我在互联网上的其他地方发现了人们正在努力解决这个问题。
所以,我想出了一个变通办法。我们可以使用条件语句nrow(result) == 0
来代替函数dbHasCompleted
。
例如:
result <- dbSendQuery(conn, query);
repeat {
chunk <- dbFetch(result, n = 10);
if(nrow(chunk) == 0){
break;
}
# Do something with 'chunk';
}
dbClearResult(result);