基础
MySQL
MySQL
  • 基础知识
    • MySQL 的安装与配置
      • Windows
        • 安装
        • 配置文件
      • Linux
        • 安装
        • 配置文件
      • docker
      • mysql 配置文件格式
    • MySQL 查询的执行过程
      • MySQL 的客户端/服务器通信协议
      • MySQL 查询优化器
        • 优化器可能选择错误的执行计划
        • MySQL 能够处理的优化类型
          • 优化 COUNT()、MIN() 和 MAX()
          • 预估并转化为常数表达式
          • 提前终止查询
          • 排序优化
      • MySQL如何执行联接查询
    • 事务
      • ACID
      • 隔离级别
      • 死锁
      • 事务日志
      • 两阶段锁定协议
      • 多版本并发控制(MVCC)
  • SQL 优化
    • schema 设计
      • 选择数据类型
        • 整数类型
        • 实数类型
        • 字符串类型
          • VARCHAR 和 CHAR
          • BINARY 和 VARBINARY
          • BLOB 和 TEXT
          • ENUM 和 SET
        • 日期类型
      • 选择标识符
    • 索引
      • HASH 索引
      • B-tree 索引
      • 聚簇索引
      • 覆盖索引
      • 前缀索引和索引的选择性
      • 索引合并
      • 选择合适的索引列顺序
      • 使用索引扫描来做排序
      • 维护索引和表
    • 查询优化
      • 优化 SQL 语句的一般步骤
        • 1. 通过 show status 命令了解各种 SQL 的执行频率
        • 2. 定位执行效率较低的 SQL 语句
        • 3. 通过 EXPLAIN 分析低效 SQL 的执行计划
        • 4. 通过 SHOW PROFILE 分析 SQL
        • 5. 通过 TRACE 分析优化器如何选择执行计划
        • 6. 确定问题并采取相应的优化措施
      • 两个简单实用的优化方法
      • 一个复杂查询还是多个简单查询
      • 常用 SQL 的优化
        • 大批量插入数据
        • 优化 GROUP BY 语句
        • 优化联接查询
        • 优化分页查询
        • 优化 SQL_CALC_FOUND_ROWS
        • 优化 UNION 查询
    • Performance Schema
      • 配置
      • 使用
        • 检查SQL语句
        • 检查预处理语句
        • 语句剖析
        • 检查读写性能
        • 检查内存使用情况
        • 检查变量
    • MySQL线程
    • 复制
      • 概述
        • 复制中的各类文件
        • 三种复制格式
        • 全局事务标识符(GTID)
        • 崩溃后的复制安全
      • 安装
        • 基于二进制日志文件位置的复制
        • 基于GTID的复制
      • 复制拓扑
        • 主动/被动模式
        • 主动/只读池模式
        • 多级复制架构
  • 其他
    • 查询缓存
    • 批量insert
    • MySQL 锁的类型
    • MySQL 的索引有哪些
    • INSERT ... ON DUPLICATE KEY UPDATE Statement
由 GitBook 提供支持
在本页
  1. SQL 优化
  2. 索引

索引合并

MySQL 引入了一种叫“索引合并”(index merge)的策略,它在一定程度上可以使用表中的多个单列索引来定位指定的行。在这种情况下,查询能够同时使用两个单列索引进行扫描,并将结果进行合并。这种算法有三个变种:

  • OR 条件的联合(union)

  • AND 条件的相交(intersection)

  • 组合前两种情况的联合及相交

下面的查询就使用了两个索引扫描的联合,通过 EXPLAIN 中的 Extra 列可以看到这点:

EXPLAIN
SELECT *
FROM film
WHERE film_id = 1
   OR language_id = 1;
+-------------+--------------------------+
|id           |1                         |
+-------------+--------------------------+
|select_type  |SIMPLE                    |
+-------------+--------------------------+
|table        |film                      |
+-------------+--------------------------+
|partitions   |NULL                      |
+-------------+--------------------------+
|type         |ALL                       |
+-------------+--------------------------+
|possible_keys|PRIMARY,idx_fk_language_id|
+-------------+--------------------------+
|key          |NULL                      |
+-------------+--------------------------+
|key_len      |NULL                      |
+-------------+--------------------------+
|ref          |NULL                      |
+-------------+--------------------------+
|rows         |1000                      |
+-------------+--------------------------+
|filtered     |100                       |
+-------------+--------------------------+
|Extra        |Using where               |
+-------------+--------------------------+

索引合并策略有时候效果非常不错,但更多的时候,它说明了表中的索引建得很糟糕:

  • 当优化器需要对多个索引做相交操作时(通常有多个 AND 条件),通常意味着需要一个包含所有相关列的多列索引。

  • 当优化器需要对多个索引做联合操作时(通常有多个 OR 条件),通常需要在算法的缓存、排序和合并操作上耗费大量 CPU 和内存资源,尤其是当其中有些索引的选择性不高,需要合并扫描返回的大量数据的时候。

    更重要的是,优化器不会把这些操作计算到“查询成本”(cost)中,优化器只关心随机页面读取。这会使得查询的成本被“低估”,导致该执行计划还不如直接进行全表扫描。这样做不但会消耗更多的 CPU 和内存资源,还可能会影响并发的查询,但如果单独运行这样的查询则往往会忽略对并发性的影响。通常来说,使用 UNION 改写查询,往往是最好的办法。

如果在 EXPLAIN 中看到有索引合并,那么就应该好好检查一下查询语句的写法和表的结构,看是不是已经是最优的。也可以通过参数 optimizer_switch 来关闭索引合并功能,还可以使用 IGNORE INDEX 语法让优化器强制忽略掉某些索引,从而避免优化器使用包含索引合并的执行计划。

上一页前缀索引和索引的选择性下一页选择合适的索引列顺序

最后更新于8个月前