'h2o'包是一个有趣的ML java工具,可以通过R访问。用于访问'h2o'的R包被称为"h2o"。
输入途径之一是告诉"h2o"csv文件在哪里,并让"h2o"上传原始csv。只需指出文件夹并告诉'h2o'使用h2o.importFolder
命令导入"其中的所有内容"会更有效。
有没有办法指出一个包含"gzip"或"bzip"csv文件的文件夹,并让"h2o"导入它们?
根据这个链接(这里),h2o可以导入压缩文件。我只是不知道如何为importFolder方法指定这一点。
导入压缩表单是快还是慢?如果我有另一个输出程序,如果它们被压缩,它会在h2o导入过程中为我节省时间吗?如果它们是原始文本?我们感谢指导方针和性能最佳实践。
一如既往,我们会征求意见、建议和反馈。
我接受了@screarOwl的建议,在0xdata.atlassian.net板上询问了h2o,得到了明确的答案:
它由用户"cliff"提供。
嗨,是的H2O-导入文件夹时-会获取文件夹中的所有文件;它根据需要解压缩gzip或zip文件,并将它们全部解析为一个大型CSV。所有文件都必须在CSV意义上兼容——列的数量和种类相同。
H2O当前不处理bzip文件。