使用 R 将压缩的 CSV 导入"H2O"



'h2o'包是一个有趣的ML java工具,可以通过R访问。用于访问'h2o'的R包被称为"h2o"。

输入途径之一是告诉"h2o"csv文件在哪里,并让"h2o"上传原始csv。只需指出文件夹并告诉'h2o'使用h2o.importFolder命令导入"其中的所有内容"会更有效。

有没有办法指出一个包含"gzip"或"bzip"csv文件的文件夹,并让"h2o"导入它们?

根据这个链接(这里),h2o可以导入压缩文件。我只是不知道如何为importFolder方法指定这一点。

导入压缩表单是快还是慢?如果我有另一个输出程序,如果它们被压缩,它会在h2o导入过程中为我节省时间吗?如果它们是原始文本?我们感谢指导方针和性能最佳实践。

一如既往,我们会征求意见、建议和反馈。

我接受了@screarOwl的建议,在0xdata.atlassian.net板上询问了h2o,得到了明确的答案:

它由用户"cliff"提供。

嗨,是的H2O-导入文件夹时-会获取文件夹中的所有文件;它根据需要解压缩gzip或zip文件,并将它们全部解析为一个大型CSV。所有文件都必须在CSV意义上兼容——列的数量和种类相同。

H2O当前不处理bzip文件。

相关内容

  • 没有找到相关文章

最新更新