动态数据屏蔽BigQuery



BigQuery路线图中是否有支持动态数据屏蔽的功能?例如,显示基于用户角色的屏蔽数据。我已经研究了DLP,它有助于在BigQuery中存储屏蔽数据,但使用这种方法,必须创建同一表的屏蔽和非屏蔽两个版本。请参考以下链接作为示例,以获取我的请求的其他上下文。(链接示例(

正如Guillaume所指出的,目前正确的解决方法是使用BigQuery列级别的安全性来控制对特定表列的访问。

至于特定的数据屏蔽功能,其中列数据被返回但被屏蔽,这确实在BigQuery路线图上,预计将作为BigQuery列级安全性的一部分发布。然而,目前还没有发布任何预计到达时间。

您可以参考谷歌的Bigquery发布说明,了解最新的Bigquery更新和功能发布。

没有完全相同的功能。而且,实际上,您必须存储两种形式的数据,屏蔽和非屏蔽。

但是,您有一个名为CLS的新功能:列级安全性。使用此功能,您可以允许用户查看或不查看某个列。在您的用例中,您可以只向用户显示未屏蔽的列

对于任何看到这个的人。。只需使用授权的视图。。如果你需要确定性的东西,你可以对数据进行散列,或者你可以使用字符串/regex函数来屏蔽数据。

对于那些正在考虑列级安全性(即使用策略标记(的人来说,这只是一个仅供参考的信息。我在这里浏览是因为我们目前遇到了一些政策标签的限制。

我们有一些列不能向最终用户公开,emailAddress就是一个很好的例子,因此我们在它上面有一个策略标签,阻止访问它。然而,emailAddress仍然是最终用户回答等问题的一个非常有用的列

有多少不同的用户访问了我们的网站?

因此,我们考虑将视图放在执行此操作的表的顶部:

select SHA256("some-pepper-value", emailAddress) AS emailAddressHash

这将使最终用户能够使用模糊标识符(并使他们能够在emailAddressHash上将表连接在一起,这也是一件重要的事情(。不幸的是,它不起作用,因为BigQuery意识到列emailAddress仍在被引用,因此阻止了对emailAddressHash的访问。因此,我一直在谷歌上搜索";BigQuery中的动态数据屏蔽";让我来到这里。

该功能昨天发布:https://cloud.google.com/bigquery/docs/column-data-masking-intro

不确定它是否完全涵盖了您的需求,但肯定适用于简单的情况。

最新更新