Hive orc文件格式



当我们在Hive中创建兽人表时,我们可以看到数据被压缩而不是在HDF中完全可读。因此

感谢您的建议!

在创建表时使用orcserde。您必须为SERDE类提供包装名称。行格式''。Serde的作用是将特定格式数据序列化为对象,蜂巢可以处理,然后对其进行处理以将其存储在HDFS中。

hive使用" serde"(序列化的序列化(来做到这一点。创建表时,您提到文件格式ex:在您的情况下,它是兽人"存储为orc",对。Hive在内部使用ORC库(JAR文件(将其转换为可读格式。要了解有关Hive Internals搜索" Hive Serde"的更多信息,您将知道如何将数据转换为对象,反之亦然。

相关内容

  • 没有找到相关文章

最新更新