运行Sparkling-shell(尝试版本2.2.2 - 2.2.6(与Spark2(在Linux 7.2下的CDH 5.13下(。 CSV 和 ZIP 文件导入正常,但是当我尝试导入 Parquet 文件时,它会将其读取为 CSV 并混淆数据。
有人有什么建议吗?
香卡尔
苏打水 2.2.7 似乎效果更好。 但是,它正在寻找解析器的"h20.jar"文件。 因此,安装了最新版本的 h2o,然后在启动 spark-shell 时修改了"sparkling-shell"脚本以包含 h2o.jar 文件。
香卡。