在荷兰社区礼堂的新工作中,我们使用包含隐私敏感数据(例如公民服务号码)的数据库。他们最近也开始使用Azure,在我们说话的时候,我越来越熟悉Azure。所以这可能是一个初学者的问题,但我希望有人能引导我朝着正确的方向前进:有没有办法通过与数据库的直接连接来检索数据并使其"匿名">,例如通过散列或使用管道中的某种密钥文件? 我知道管道是.JSON 文件,并且可以进行一些转换。我很好奇在 Azure 中执行此操作的可能性!
**编辑**
更清楚的是:我想最好在管道中编写一段代码,它的作用如下:
citizen service number person 1
102541220
#generate key/hash somewhere in pipeline of loading in data in azure
anonymous citizen service number, that is specific for person 1
0x10325476
稍后,我想向此数据库添加列,例如此人居住的房屋具有什么样的价值。我希望能够通过使用
anonymous citizen service number 1
0x10325476
听起来你会对 Azure SQL 数据库动态数据掩码感兴趣。
SQL 数据库动态数据屏蔽通过以下方式限制敏感数据泄露 将其屏蔽给非特权用户。
动态数据屏蔽有助于防止未经授权访问敏感数据 数据,使客户能够指定多少敏感数据 以对应用程序层的影响最小地揭示。这是一个 基于策略的安全功能,可将敏感数据隐藏在 查询指定数据库字段的结果集,同时数据 在数据库中不会更改。
例如,呼叫中心的服务代表可以识别 来电者按其信用卡号码的几位数,但这些数据 项目不应完全暴露给服务代表。一个 可以定义屏蔽规则,以屏蔽除最后四位数字之外的所有数字 任何查询的结果集中的任何信用卡号。作为另一个 例如,可以定义适当的数据掩码来保护个人 可识别信息 (PII) 数据,以便开发人员可以查询 用于故障排除的生产环境,而不会违反 合规法规。
https://learn.microsoft.com/en-us/azure/sql-database/sql-database-dynamic-data-masking-get-started
这不会不可逆地匿名化数据,因为它可以由那些在SQL服务器中具有权限的人重新个性化。
但是,它将允许您在SQL服务器内部进行联接,但不会将个人数据暴露回去。