小贝子编程

用Hive反序列化protobuf column

本文关键字：column protobuf 反序列化 Hive hadoop hive protocol-buffers hive-serde
更新时间 : 2023-08-26
英文 : Deserialize protobuf column with Hive

我真的是Hive的新手，如果我的问题有任何误解，我道歉。

我需要读取hadoop序列文件到Hive表中，序列文件是thrift二进制数据，可以使用Hive自带的SerDe2进行反序列化。

现在的问题是:文件中的一列是用Google protobuf编码的，所以当thrift SerDe处理序列文件时，它不能正确处理protobuf编码的列。

我想知道Hive中是否有一种方法来处理这种嵌套在thrift序列文件中的protobuf编码列，以便每个列都可以正确解析?

非常感谢您的帮助!

我认为您应该使用其他服务器来反序列化原型buff格式，

也许你可以参考这个

https://github.com/twitter/elephant-bird/wiki/How-to-use-Elephant-Bird-with-Hive

最新更新

无法使用 docker 多阶段构建执行 go 二进制文件
CSS "overflow： hidden;" 仍然适用于伪 "：：after"
如何从bash中的源脚本中获取源bash-dir
JMH - 如何正确对线程池进行基准测试
当使用' show '而不是整个show字符串时，我如何访问数据类型的字段?
Open API version 3.1示例请求(json)
Laravel关系，有许多，然后是bloblostomany
CRC 16计算使用python
MongoDB聚合错误操作超过时间限制
如何修复不支持的错误与node.js ansi-html
Flutter streambuilder不更新有状态或无状态小部件
复制记录的SQL查询
在JPA / Hibernate中@GeneratedValue字段生成器的用途是什么?
Spring——将响应从一个端点连接到另一个端点的请求
孤立单词，后面跟着特定的单词组合
如何在html中添加网格列下的文本?
SQL:试图选择一个选项作为默认值时，它已经复制(oracle)
Laravel作曲家包雄辩的关系
Mongodb中的嵌套分组
在Get-WmiObject表中连接字符串到整数- PowerShell
多节表单的最佳实践
SMS - Android -来自交易的商家名称
如何从HTTP服务器停止日志记录
Java:通过TCP发送/接收数据，从UDP接收图像
如何在xcode开放开发工具中更改默认模拟器
地形属性"路线"的值不合适
过滤包含动态数据的多列
UseMethod("docvars") 中的错误：没有适用于类 "c('corpus'， 'character')"对象的 'docvars' 方法。
如何在docker中使用mongo import导入多个不同的集合
如何在GPA计算器中构建for循环?Java

用Hive反序列化protobuf column

相关内容

最新更新

热门标签：