避免往返密钥查找



所以我有一个数据库表,许多其他表都依赖于它,这意味着我需要尽早从中获取密钥。问题是,这意味着往返数据库,必要时在表中创建一行并返回键,我想知道是否有任何聪明的方法可以消除该步骤。

部分问题在于,真正唯一标识每行的列长度可变,并且可能很长,因此不适合用作键。举个例子,假设我的所有数据都是基于"域"组织的,为了简单起见,假设一个网站域。因此,我可能有两个表,如下所示:

CREATE TABLE `domains` (
`key` binary(16) NOT NULL DEFAULT X'0000000000000000',
`name` varchar(255) NOT NULL DEFAULT '',
PRIMARY KEY (`key`),
UNIQUE KEY `name` (`name`)
);
CREATE TABLE `users` (
`domain` binary(16) NOT NULL DEFAULT X'0000000000000000',
`username` varchar(64) NOT NULL DEFAULT '',
`email` varchar(255) DEFAULT '',
PRIMARY KEY (`domain`,`username`)
);

目前,为了处理此示例中的域,我将执行以下操作:

INSERT IGNORE INTO `domains` (`key`, `name`)
VALUES (UUID_TO_BIN(UUID(), TRUE), a_name);
SELECT `key` FROM `domains` WHERE `name` = a_name;

这足够有效,但正如你所看到的,它涉及往返;在我的情况下,我立即触发INSERT,而不必先SELECT,检查结果,然后返回进行另一次传递。

可预测密钥

我已经考虑过的一种替代方法是使用 v5 UUID 而不是 v1;本质上是生成name列的 SHA-1 哈希并将其存储为键。这意味着密钥总是可预测的,只知道name,因此不需要往返。事实上,如果我愿意,我甚至可以延迟或跳过INSERT

此选项的问题在于生成的 UUID 是高度随机的,这对于索引来说并不理想,因为这意味着即使是一小部分域也可以广泛分布在众多索引页面上。索引性能是为什么在上面的示例中,我使用推荐的方法来存储 UUID,使用UUID_TO_BIN(a_uuid, TRUE)对 v1 UUID 进行重新排序以提高索引性能,因此用高度随机的键替换它似乎是一个糟糕的权衡,特别是如果相同的基本键在我的数据库中广泛使用。

缓存

另一个明显的替代方法是尝试在我的应用程序中缓存域密钥,以便不需要查找已知域。

这样做的问题是我的应用程序是基于PHP的,这意味着我缓存此信息的主要方法是将其存储在文件中(烦人,但可行(或用户的$_SESSION数组中。后者虽然最简单,但取决于始终具有可用的会话 ID,这并不能保证;即 - 在没有请求包含请求的最坏情况下,我每次仍在进行完整的往返。

问题

我已经为此苦恼了一段时间,因为没有一个选项完全是理想的,我不禁动摇了这种感觉,可能有一个我不知道的聪明解决方案。

所以我的问题是;避免这种密钥检索往返的最简单方法是什么?对于我已经考虑过的问题,是否有替代方案或改进(例如 - 避免我发现的问题的方法(?

此问题的解决方案应该完全消除往返,或者在大多数情况下消除对往返的需求。

如有必要,我可以尝试提供我实际系统的更多详细信息,但实际上上面的例子应该涵盖它;即 - 在我可以做任何涉及users表的事情之前,我需要确定我需要查询的域密钥。

此选项的问题在于生成的 UUID 是高度随机的,这对于索引来说并不理想,因为这意味着即使是一小部分域也可以广泛分布在众多索引页面上。指数表现是...

我认为这可能是过早优化的情况。为集合创建的索引将在同一页中维护相邻键,而不管它们之间缺少多少键。不要试图思考数据库。它的优化对于 99% 的情况都是正确的,即使您有稀疏键也是如此。

所以我有一个数据库表,许多其他表都依赖于它,这意味着我需要尽早从中获取密钥。问题是,这意味着往返数据库,必要时在表中创建一行并返回键,我想知道是否有任何聪明的方法可以消除该步骤。

大多数数据库都有一种方法可以自动将顺序 ID 分配给列。对于MySQL该方法AUTO_INCREMENT列。将主表中的key列设置为AUTO_INCREMENT,并且不要在INSERT上为该列提供值。然后,后续插入可以使用LAST_INSERT_ID()为外键列提供值。它看起来像这样:

CREATE TABLE `domains` (
`key` INT NOT NULL AUTO_INCREMENT,
`name` varchar(255) NOT NULL DEFAULT '',
PRIMARY KEY (`key`),
UNIQUE KEY `name` (`name`)
);
CREATE TABLE `users` (
`domainid` INT NOT NULL DEFAULT 0,
`username` varchar(64) NOT NULL DEFAULT '',
`email` varchar(255) DEFAULT '',
PRIMARY KEY (`domain`,`username`)
);
INSERT INTO `domain` (`name`)
VALUES ('example.com');
INSERT INTO `users` (`domainid`,`username`,`email`)
VALUES (LAST_INSERT_ID(),'henryg','henryg@gmail.com');

没有额外的服务器行程,服务器会跟踪上次插入的 ID。

最新更新