基础
MySQL
MySQL
  • 基础知识
    • MySQL 的安装与配置
      • Windows
        • 安装
        • 配置文件
      • Linux
        • 安装
        • 配置文件
      • docker
      • mysql 配置文件格式
    • MySQL 查询的执行过程
      • MySQL 的客户端/服务器通信协议
      • MySQL 查询优化器
        • 优化器可能选择错误的执行计划
        • MySQL 能够处理的优化类型
          • 优化 COUNT()、MIN() 和 MAX()
          • 预估并转化为常数表达式
          • 提前终止查询
          • 排序优化
      • MySQL如何执行联接查询
    • 事务
      • ACID
      • 隔离级别
      • 死锁
      • 事务日志
      • 两阶段锁定协议
      • 多版本并发控制(MVCC)
  • SQL 优化
    • schema 设计
      • 选择数据类型
        • 整数类型
        • 实数类型
        • 字符串类型
          • VARCHAR 和 CHAR
          • BINARY 和 VARBINARY
          • BLOB 和 TEXT
          • ENUM 和 SET
        • 日期类型
      • 选择标识符
    • 索引
      • HASH 索引
      • B-tree 索引
      • 聚簇索引
      • 覆盖索引
      • 前缀索引和索引的选择性
      • 索引合并
      • 选择合适的索引列顺序
      • 使用索引扫描来做排序
      • 维护索引和表
    • 查询优化
      • 优化 SQL 语句的一般步骤
        • 1. 通过 show status 命令了解各种 SQL 的执行频率
        • 2. 定位执行效率较低的 SQL 语句
        • 3. 通过 EXPLAIN 分析低效 SQL 的执行计划
        • 4. 通过 SHOW PROFILE 分析 SQL
        • 5. 通过 TRACE 分析优化器如何选择执行计划
        • 6. 确定问题并采取相应的优化措施
      • 两个简单实用的优化方法
      • 一个复杂查询还是多个简单查询
      • 常用 SQL 的优化
        • 大批量插入数据
        • 优化 GROUP BY 语句
        • 优化联接查询
        • 优化分页查询
        • 优化 SQL_CALC_FOUND_ROWS
        • 优化 UNION 查询
    • Performance Schema
      • 配置
      • 使用
        • 检查SQL语句
        • 检查预处理语句
        • 语句剖析
        • 检查读写性能
        • 检查内存使用情况
        • 检查变量
    • MySQL线程
    • 复制
      • 概述
        • 复制中的各类文件
        • 三种复制格式
        • 全局事务标识符(GTID)
        • 崩溃后的复制安全
      • 安装
        • 基于二进制日志文件位置的复制
        • 基于GTID的复制
      • 复制拓扑
        • 主动/被动模式
        • 主动/只读池模式
        • 多级复制架构
  • 其他
    • 查询缓存
    • 批量insert
    • MySQL 锁的类型
    • MySQL 的索引有哪些
    • INSERT ... ON DUPLICATE KEY UPDATE Statement
由 GitBook 提供支持
在本页
  • ORDER BY NULL
  • WITH ROLLUP
  1. SQL 优化
  2. 查询优化
  3. 常用 SQL 的优化

优化 GROUP BY 语句

ORDER BY NULL

默认情况下,MySQL 会根据分组字段进行排序。对于含有 GROUP BY col1, col2, … 的 SQL 语句,相当于隐式地包含了一个 ORDER BY col1, col2, … 子句。

如果查询包括 GROUP BY 但想要避免排序结果的消耗,则可以指定 ORDER BY NULL 来禁止排序。

EXPLAIN
SELECT payment_date, SUM(amount)
FROM payment
GROUP BY payment_date;

+-------------+-------------------------------+
|id           |1                              |
+-------------+-------------------------------+
|select_type  |SIMPLE                         |
+-------------+-------------------------------+
|table        |payment                        |
+-------------+-------------------------------+
|partitions   |NULL                           |
+-------------+-------------------------------+
|type         |ALL                            |
+-------------+-------------------------------+
|possible_keys|NULL                           |
+-------------+-------------------------------+
|key          |NULL                           |
+-------------+-------------------------------+
|key_len      |NULL                           |
+-------------+-------------------------------+
|ref          |NULL                           |
+-------------+-------------------------------+
|rows         |16086                          |
+-------------+-------------------------------+
|filtered     |100                            |
+-------------+-------------------------------+
|Extra        |Using temporary; Using filesort|
+-------------+-------------------------------+

在 Extra 列中的 “Using filesort” 表明了上述 SQL 语句含有排序语义,若想要去除排序语义,在 SQL 语句后面添加一个 ORDER BY NULL 子句:

EXPLAIN
SELECT payment_date, SUM(amount)
FROM payment
GROUP BY payment_date
ORDER BY NULL; 

+-------------+---------------+
|id           |1              |
+-------------+---------------+
|select_type  |SIMPLE         |
+-------------+---------------+
|table        |payment        |
+-------------+---------------+
|partitions   |NULL           |
+-------------+---------------+
|type         |ALL            |
+-------------+---------------+
|possible_keys|NULL           |
+-------------+---------------+
|key          |NULL           |
+-------------+---------------+
|key_len      |NULL           |
+-------------+---------------+
|ref          |NULL           |
+-------------+---------------+
|rows         |16086          |
+-------------+---------------+
|filtered     |100            |
+-------------+---------------+
|Extra        |Using temporary|
+-------------+---------------+

WITH ROLLUP

分组查询的一个变种就是要求 MySQL 对返回的分组结果再做一次超级聚合。可以使用 WITH ROLLUP 子句来实现这种逻辑。

SELECT 
    YEAR(rental_date) y, 
    MONTH(rental_date) m, 
    COUNT(*) num
FROM rental
GROUP BY y, m
WITH ROLLUP;
+----+----+-----+
|y   |m   |num  |
+----+----+-----+
|2005|5   |1156 |
|2005|6   |2311 |
|2005|7   |6709 |
|2005|8   |5686 |
|2005|NULL|15862|
|2006|2   |182  |
|2006|NULL|182  |
|NULL|NULL|16044|
+----+----+-----+

注:根据上面的实例,可以推断出 GROUP BY y, m WITH ROLLUP,相当于 GROUP BY y,GROUP BY y, m 和 GROUP BY NULL(无 GROUP BY)三者的 UNION(并集),即等价于以下语句:

(
    SELECT YEAR(rental_date) y, MONTH(rental_date) m, COUNT(*) num
    FROM rental
    GROUP BY y, m
) UNION ALL (
    SELECT YEAR(rental_date) y, NULL, COUNT(*) num
    FROM rental
    GROUP BY y
) UNION ALL (
    SELECT NULL, NULL, COUNT(*) num
    FROM rental
);

应该尽可能地将 WITH ROLLUP 功能转移到应用程序中处理,在应用程序中做超级聚合是更好的,虽然这需要给客户端返回更多的结果。

上一页大批量插入数据下一页优化联接查询

最后更新于8个月前