MySQL如何执行联接查询

MySQL 认为每一个查询都是联接——不仅是匹配两张表中对应行的查询,而是每一个查询、每一个片段(包括子查询,甚至基于单表的 SELECT)都是联接。

当前 MySQL 的联接执行策略很简单:MySQL 对任何联接都执行嵌套循环联接操作,即 MySQL 先在一个表中循环取出单条数据,然后再嵌套循环到下一个表中寻找匹配的行,依次下去,直到找到所有表中匹配的行为止。最后根据各个表匹配的行,返回查询中需要的各列。

在 MySQL 8.0.20 版本之后,已经不再使用基于块的嵌套循环联接操作,取而代之的是哈希联接。这让联接操作性能变得更好,特别是当数据集可以全部存储在内存中时。

对于 UNION 查询,MySQL 先将一系列的单个查询结果放到一个临时表中,然后再重新读出临时表中的数据来完成 UNION 查询。

联接查询优化器

联接查询优化器决定了多个表联接时的顺序。通常多表联接的时候,可以有多种不同的联接顺序来获得相同的执行结果。联接查询优化器通过评估不同联接顺序的成本来选择一个成本最低的联接顺序。

联接优化器会尝试在所有的联接顺序中选择一个成本最低的来生成执行计划树。如果可能,优化器会遍历每一个表,然后逐个做嵌套循环,计算执行每一种联接顺序的成本,最后返回一个最优的执行计划。不过,糟糕的是,n 个表的联接可能有 n 的阶乘种联接顺序,我们称之为所有可能的查询计划的“搜索空间”。当搜索空间非常大的时候,优化器不可能逐一评估每一种联接顺序的成本。这时,优化器选择使用“贪婪”搜索的方式查找“最优”的联接顺序。实际上,当需要联接的表超过 optimizer_search_depth 的限制的时候,就会选择“贪婪”搜索模式了

在 MySQL 这些年的发展过程中,优化器积累了很多“启发式”的优化策略来加速执行计划的生成。在绝大多数情况下这都是有效的,但因为不会去计算每一种联接顺序的成本,所以偶尔也会选择不是最优的执行计划。

提示

若优化器给出的并不是最优的联接顺序,可以使用 STRAIGHT_JOIN 关键字重写查询,让优化器按照你认为的最优的联接顺序执行。

最后更新于