我在谷歌上做实验,提供了一篇文章,使用AES-SIV 使用确定性加密重新识别信用卡号
https://cloud.google.com/solutions/creating-cloud-dlp-de-identification-transformation-templates-pii-dataset#creating_a_key_encryption_key_kek
因此,我创建了一个谷歌DLP模板来识别数据,在该模板的测试选项中,如果我们提供一个具有正确标题名称的3行csv,它就可以工作[我使用的是记录类型模板]
DLP模板
DLP模板测试
根据以下链接和提供的视频,可以使用相同的模板将数据重新标识回原始
"Cloud DLP可以在使用不带代理项的RecordTransformation的整列注释">
https://cloud.google.com/dlp/docs/pseudonymization#cryptographic-散列
但当我们尝试同样的方法时,它会再次将其重新编码为新编码的值,如下所示。
DLP模板重新识别不工作的
请让我知道我做错了什么,以及如何使用AES-SIV成功使用确定性加密重新识别PII
注意:这与我继续阅读前面的文章时的行为相同,并且没有像预期的那样在博客中重新识别数据
https://cloud.google.com/solutions/validating-de-identified-data-bigquery-re-identifying-pii-data
您不能在控制台上重新验证,您需要使用API。而且,因为您不使用代理前缀,所以您必须用JSON重建表(这很无聊…或者您可以编写脚本(。
你有API的全部细节在这里
要登顶的JSON:表(您的指定表和模板使用(
{
"item": {
"table": {
"headers": [
{
"name": "id"
},
{
"name": "phone"
},
{
"name": "email"
}
],
"rows": [
{
"values": [
{
"stringValue": "1"
},
{
"stringValue": "ASoxvJC6oo4fCgKm+ppgT6j2lSqdj179SbLc"
},
{
"stringValue": "ARkspehZ720J0f/r5zqlVN65PS756cxQDbwSniZ+g8iV"
}
]
},
{
"values": [
{
"stringValue": "2"
},
{
"stringValue": "ATfmBVs25TEGYHLu+6DBBhpq6dk8LSJq+XyR"
},
{
"stringValue": "AZZhJLTmQKjlcXEROCRPu9u81G98/SBac/AlWXwtgiYe"
}
]
}
]
}
},
"reidentifyTemplateName": "projects/<YOUR_PROJECT>/locations/global/deidentifyTemplates/test-email-DeId"
}
我将内容保存在名为dlpdata.json
的文件中
调用API 的curl请求
curl -H "Content-type: application/json"
-H "Authorization: Bearer $(gcloud auth print-access-token)"
-X POST -d @dlpdata.json
https://dlp.googleapis.com/v2/projects/<YOUR_PROJECT>/content:reidentify