bigQuery Google Cloud 如何与其他用户共享数据集?使用蟒蛇



我有一个使用我的userA帐户在Google Cloud中定义的bigQuery数据集,我希望我的同事userB(他是同一组的成员)能够看到我定义的数据集。使用 bq 命令行界面,用户 B 可以看到项目,但不能查看数据集。如何使用 python 脚本与用户 B 共享用户 A 创建的数据集?

您可能会遇到的另一件事是,您必须在 BigQuery 中授予数据集级别的访问权限。 根据您在云平台和 BigQuery 中设置用户角色的方式,您可能需要授予服务帐户对 Bigquery 数据集的直接访问权限。

为此,请进入 BigQuery,将鼠标悬停在您的数据集上,然后单击向下箭头,选择"共享数据集"。将打开一个模式,然后您可以在其中指定要与之共享数据集的电子邮件地址和服务帐户并控制其访问权限。

如果我的说明太混乱,请告诉我,我将上传一些图片,显示如何做到这一点。

祝你好运!!

使用 Python 客户端库的示例。从这里改编,但添加了一个get_dataset调用以获取现有数据集的当前 ACL 策略:

from google.cloud import bigquery
project_id = "PROJECT_ID"
dataset_id = "DATASET_NAME"
group_name= "google-group-name@google.com"
role = "READER"
client = bigquery.Client(project=project_id)
dataset_info = client.get_dataset(client.dataset(dataset_id))
access_entries = dataset_info.access_entries
access_entries.append(
        bigquery.AccessEntry(role, "groupByEmail", group_name)
)
dataset_info.access_entries = access_entries
dataset_info = client.update_dataset(
    dataset_info, ['access_entries']) 

另一种方法是使用Google Python API Client以及get和patch方法。首先,我们检索现有的数据集 ACL,将组作为READER添加到响应中,并修补数据集元数据:

from oauth2client.client import GoogleCredentials
from googleapiclient import discovery
project_id="PROJECT_ID"
dataset_id="DATASET_NAME"
group_name="google-group-name@google.com"
role="READER"    
credentials = GoogleCredentials.get_application_default()
bq = discovery.build("bigquery", "v2", credentials=credentials)
response = bq.datasets().get(projectId=project_id, datasetId=dataset_id).execute()
response['access'].append({u'role': u'{}'.format(role), u'groupByEmail': u'{}'.format(group_name)})
bq.datasets().patch(projectId=project_id, datasetId=dataset_id, body=response).execute()

相应地替换project_iddataset_idgroup_namerole变量。

使用的版本:

$ pip freeze | grep -E 'bigquery|api-python'
google-api-python-client==1.7.7
google-cloud-bigquery==1.8.1

最新更新