重新设计一个自引用的mysql表



我继承了一个遗留应用程序,该应用程序使用自引用表来促进层次结构。这会导致递归方法调用产生"臭味"。

parent_id列引用同一个表的主键,这里大约有2500万条记录:

+-------------+---------+------+-----+---------+----------------+
| Field       | Type    | Null | Key | Default | Extra          |
+-------------+---------+------+-----+---------+----------------+
| phase_id    | int(10) | NO   | PRI | NULL    | auto_increment |
| plat_id     | int(10) | YES  | MUL | NULL    |                |
| name        | text    | YES  |     | NULL    |                |
| parent_id   | int(10) | YES  | MUL | NULL    |                |
| plan_id     | int(10) | YES  | MUL | NULL    |                |
+-------------+---------+------+-----+---------+----------------+
mysql> show table status like 'ref'G
*************************** 1. row ***************************
Name: phase
Engine: MyISAM
Version: 10
Row_format: Dynamic
Rows: 25223658
Avg_row_length: 20
Data_length: 509450960
Max_data_length: 281474976710655
Index_length: 1026267136
Data_free: 0
Auto_increment: 25238013

关于这种结构,我有几个问题:

  • 实现自引用表通常是一种糟糕的做法吗?我能想到的主要负面影响是,很难/不可能在单个查询中获得层次结构的最大深度,因为可能有X个子级
  • 这个值得重新设计吗?拥有如此多的数据使得移动数据变得更加困难
  • 我有什么选择?我听过一些关于表分区的知识,但不知道它是否适合我的场景

任何建议都将不胜感激ns

我们最终废弃了现有的自引用表。并创建了一张新桌子来放置一个更简单的模型。

感谢Sebas的链接。里面有很多美好的东西!

最新更新