我已经开始阅读关于Databricks引入的Unity Catalog。我理解它试图解决的基本问题,但我不明白Catalog到底是什么。
可以在Databricks文档中找到,
目录包含模式(数据库),模式包含表和视图。
https://docs.databricks.com/data-governance/unity-catalog/create-catalogs.html
这个添加的层(在模式之上)是如何帮助的?我猜它与治理?
如果可能的话,我希望能举个例子。
实际上,Catalog是在更大的对象- Unity Catalog Metastore中的另一个数据管理层。与Catalog最接近的类比是单个Hive Metastore——它也包含包含表和视图的数据库(模式)。目录可用于将某些实体(业务单位/项目/环境(开发、阶段、产品)等)的对象与其他实体的对象隔离开来。您可以将目录的管理权限授予业务单元、项目、…的相应管理员。,然后他们可以在单个模式和表/视图上分配权限。