我对mysql很陌生。我有 2 个相同的 mysql 表,每个表有 50K 行(70 列)。这些表每天通过数据馈送更新。我需要执行一些嵌套查询,如交集/减法等。
我尝试使用的查询之一如下所示。但它不能正常工作。要么需要 5 分钟到 10 分钟(通过终端),要么没有响应。
SELECT *
FROM table1
WHERE table1.sku IN (SELECT t1.sku
FROM ((SELECT DISTINCT sku
FROM table2)
UNION ALL
(SELECT DISTINCT sku
FROM table1)) AS t1
GROUP BY sku
HAVING Count(*) >= 2)
如何使其更快/正常工作?我应该如何配置表/列(索引、主键等)还是我需要在 mysql 服务器上进行任何调整?
我尝试了几件事。我在 'sku' 上创建了索引,它们是 varchar(75)列。我的数据库服务器在 1 核处理器(数字海洋)服务器上运行具有 512MB 内存。
使用"解释"---查询
+----+--------------------+-----------------------+-------+---------------+---------+---------+------+-------+---------------------------------+
| id | select_type | table | type | possible_keys | key | key_len | ref | rows | Extra |
+----+--------------------+-----------------------+-------+---------------+---------+---------+------+-------+---------------------------------+
| 1 | PRIMARY | table1 | ALL | NULL | NULL | NULL | NULL | 30260 | Using where |
| 2 | DEPENDENT SUBQUERY | <derived3> | ALL | NULL | NULL | NULL | NULL | 65677 | Using temporary; Using filesort |
| 3 | DERIVED | table2 | range | NULL | sku_idx | 227 | NULL | 31016 | Using index for group-by |
| 4 | UNION | table1 | range | NULL | sku | 227 | NULL | 30261 | Using index for group-by |
| NULL | UNION RESULT | <union3,4> | ALL | NULL | NULL | NULL | NULL | NULL | |
+----+--------------------+-----------------------+-------+---------------+---------+---------+------+-------+---------------------------------+
如果我正确理解了这个特定的查询,您正在尝试显示表1中在表2中具有相应sku
的所有记录。
这可以通过更简单的查询来实现:
SELECT *
FROM table1
WHERE table1.sku IN (SELECT DISTINCT table2.sku FROM table2 )
GROUP BY table1.sku
或者,使用联接:
SELECT table1.*
FROM table1
INNER JOIN table2 ON table1.sku = table2.sku
GROUP BY table1.sku
如果您有索引table1.sku
和table2.sku
,这应该立即起作用