我在理解SQL闭包表时遇到了一些困难,希望能帮助我理解我找到的一些示例。
假设我有一个名为sample_items
的表,其中包含以下分层数据:
id name parent_id
1 'Root level item #1' 0
2 'Child of ID 1' 1
3 'Child of ID 2' 2
4 'Root level item #2' 0
树结构应该是这样的:
id
| - 1
| | - 2
| | - 3
| - 4
为了便于查询树(例如查找特定id的所有子代),我使用Bill Karwin在这篇优秀的SO文章中描述的方法创建了一个名为sample_items_closure
的表。我还使用了一个可选的path_length
列,用于在需要时查询直属子级或父级。如果我正确理解这个方法,我的闭包表数据将如下所示:
ancestor_id descendant_id path_length
1 1 0
2 2 0
1 2 1
3 3 0
2 3 1
1 3 2
4 4 0
sample_items
中的每一行现在在sample_items_closure
表中都有一个条目,用于它自己和它的所有祖先。到目前为止一切都有意义。
然而,在研究其他闭包表示例时,我遇到了一个例子,它为链接到根级别(ancestor_id 0)的每一行添加了一个额外的祖先,并且路径长度为0。使用我上面的相同数据,这就是闭包表的样子:
ancestor_id descendant_id path_length
1 1 0
0 1 0
2 2 0
1 2 1
0 2 0
3 3 0
2 3 1
1 3 2
0 3 0
4 4 0
0 4 0
为了提供更好的上下文,这里有一个在该网站上使用的选择查询,经过修改以适合我的示例:
SELECT `id`,`parent_id` FROM `sample_items` `items`
JOIN `sample_items_closure` `closure`
ON `items`.`id` = `closure`.`descendant_id`
WHERE `closure`.`ancestor_id` = 2
我有两个问题与这种方法有关:
问题1:
为什么要添加一行,将每个子体链接到根级别(id 0)?
问题2:
为什么这些条目的path_length为0,而不是前一个祖先的path_llength+1?例如:
ancestor_id descendant_id path_length
1 1 0
0 1 1
2 2 0
1 2 1
0 2 2
3 3 0
2 3 1
1 3 2
0 3 3
4 4 0
0 4 1
奖金问题:当树的完整结构已经在闭包表中表达时,为什么有些例子仍然包括邻接列表(在我的例子中是sample_items
的parent_id
列)?
您可以使用CTE。它们正是为那些用例而设计的,并且有许多非常好的示例,这些示例与您的用例非常接近。