如何访问Databricks Repos元数据



是否有方法访问Repo中笔记本内的数据,如Repo url和Branch name?也许dbutils中有什么。

您可以使用Repos API,特别是Get命令。您可以通过dbutils从可用的笔记本上下文中提取笔记本路径,然后执行以下两个查询:

  1. 通过Workspace API按路径获取回购ID(回购路径始终由3个组件组成-/Repos、目录(用于用户或自定义(和实际存储库名称(
  2. 获取回购数据

类似这样的东西:

import json
import requests
ctx = json.loads(
dbutils.notebook.entry_point.getDbutils().notebook().getContext().toJson())
notebook_path = ctx['extraContext']['notebook_path']
repo_path = '/'.join(notebook_path.split('/')[:4])
api_url = ctx['extraContext']['api_url']
api_token = "your_PAT_token"
repo_dir_data = requests.get(f"{api_url}/api/2.0/workspace/get-status",  
headers = {"Authorization": f"Bearer {api_token}"},
json={"path": repo_path}).json()
repo_id = repo_dir_data['object_id']
repo_data = requests.get(f"{api_url}/api/2.0/repos/{repo_id}",  
headers = {"Authorization": f"Bearer {api_token}"}
).json()

最新更新