我想知道使用 ORC 和 Parquet 格式存储长文本的合适数据类型是什么。这两种格式中的任何一种对其默认字符串类型是否有长度/大小限制?
谢谢。
Apache Parquet 中默认字符串类型UTF8
没有长度限制,您可以在其中保存任意长度的字符串。这是一个可变长度类型,即在结果文件中仅使用存储的字符串的长度。