我在 s3 上有兽人格式的大量数据。 我的要求是屏蔽某些列。变化最小的最佳方法是什么?
我可以定义 hive 表级别 udf 吗,并且默认情况下从 hive/preso 引用列时,udf 将即时挖掘和屏蔽数据?
您的回复将不胜感激。 谢谢!
这称为列掩码。 为此,通常将 Presto(或 Hive(与 Ranger 安全性一起使用,并在其中配置列掩码。
Ranger定义了一组预定义的掩码(例如,除最后4个字符/数字外的所有掩码等(。
Ranger还允许自定义蒙版(自由样式表达(,但Presto尚不支持。