什么更快，subselect或distinct(MySQL)

让我描述一下我的疑虑。我有一个系统，我有三个实体，医生，病人和预约。预约有医生id和患者id。

我现在需要检索所有与具体医生预约的患者，我不确定什么会更快，一个不同的id或一个子选择id，这些是查询：

使用不同->

SELECT DISTINCT patient.id, patient.name, patient.surname FROM
appointment INNER JOIN patient ON patient.id = appointment.patientid WHERE
appointment.doctorid = @id;

使用子选择->

SELECT patient.id, patient.name, patient.surname FROM patient
WHERE patient.id IN (select appointment.patientid FROM appointment 
WHERE appointment.doctorid = @id);

不确定这是否会影响，系统将在MariaDB集群上运行。

与任何性能问题一样，您应该在数据和硬件上进行测试。第一个版本中的可疑问题是DISTINCT在JOIN之后；这可能需要大量的额外处理。

您可以将第二个写为：

SELECT p.id, p.name, p.surname
FROM patient p
WHERE p.id IN (select a.patientid FROM appointment a WHERE a.doctorid = @id);

为此，您需要appointment(doctorid, patientid)上的索引。

你也可以考虑这个版本：

select p.id, p.name, p.surname
from patient p join
     (select distinct appointment.patientid
      from appointment
      where appointment.doctorid = @id
     ) a
     on p.id = a.patientid;

这特别需要相同的索引。这会推送distinct，因此它只在单个表上操作，这意味着MySQL可能能够使用索引进行该操作。

这个：

SELECT p.id, p.name, p.surname
FROM patient p
WHERE EXISTS (select 1
              from appointment a
              where a.doctorid = @id and a.patientid = p.id
             );

此查询需要appointment(patientid, doctorid)上的索引。它需要对patient进行全表扫描，并对每行进行快速索引查找。这通常是最快的方法，具体取决于数据。

注意：哪个查询执行得更好可能还取决于数据的大小和分布。

两者都没有。

这些遭受"膨胀-收缩"。也就是说，JOIN导致临时表中有更多的行，只是为了修剪回您需要的行。这是昂贵的。（它可能会对COUNT和SUM给出错误的答案。）

SELECT DISTINCT ... JOIN ...
and
SELECT ... JOIN ... GROUP BY ...

由于优化器的限制，这一操作表现不佳：

... IN ( SELECT ... )

这就是你想要的：

SELECT ...
    FROM ( SELECT id FROM ... WHERE ... )
    JOIN ...

如果子查询需要DISTINCT、GROUP BY和/或LIMIT，则特别好。这是因为它将在执行JOIN之前创建一小组行，从而减少所需的JOINs的数量。

我认为约会应该有一个id来加入。。。所以这里有一个代码。。。我希望它能帮助

SELECT patient.id, patient.name, patient.surname FROM patient
INNER JOIN appointment ON appointment.id = patient.patientid 
INNER JOIN doctor ON doctor.id = appointment.id
WHERE appointment.doctorid = @id

相关内容

最新更新

热门标签：