r语言 - H2O 不能从 H2OParsedData 中子集列



我使用 h2o(2.8.4.4) 作为 R 的 hadoop 使用。我想从数据框中获取一些包含 720512 行和 788 列的列。我写的是这样的东西:

library("h2o");
localH2O = h2o.init(ip = ipItem, port = 54321, startH2O = F)
waterTrain <- h2o.importFile(localH2O, path=trainName, key="trainKey", parse=T, header=T, sep="*")
subset <- waterTrain[, 1:787]
Error: Expectation failed

我做错了什么?

您可以使用 as.data.frame 方法将 waterTrain 转换为数据框,然后使用标准 R 方法方便地进行过滤(子集)

waterTrain.data.frame <- as.data.frame(waterTrain)

或者,您也可以,

irisPath <- system.file("extdata", "iris.csv", package="h2o")
iris.hex <- h2o.importFile(localH2O, path = irisPath, key = "iris.hex")
iris.hex.top10 <- iris.hex[1:10,1:3]

最新更新