面试技术官：以MySQL为例，请介绍一条SQL的执行过程和原理！

内容分享2个月前发布安南

在日常开发中，我们常常写出类似这样的 SQL：

SELECT name, age FROM users WHERE id = 100;

只需一行代码，就能从百万级数据中精准获取结果。但你是否想过——这条 SQL 在 MySQL 内部究竟经历了怎样的旅程？

今天，就让我们跟随这条 SQL，走进 MySQL 的“内部世界”，揭开它从输入到输出的完整执行过程。

第一站：连接器（Connector）

当你通过客户端（如 MySQL CLI、JDBC、ORM 框架）发起请求时，连接器第一登场。

它负责与客户端建立连接；
验证用户名和密码；
获取该用户拥有的权限（后续所有操作都会基于此权限校验）；
维持和管理连接（包括空闲超时断开等）。

小知识：show processlist; 可以查看当前所有连接状态。

第二站：查询缓存（Query Cache）【MySQL 8.0 已移除】

在 MySQL 5.7 及更早版本中，SQL 到达后会先检查查询缓存。

如果之前执行过完全一样的 SQL（区分大小写、空格），且对应表未被修改，MySQL 会直接返回缓存结果；
但只要表有任何更新（INSERT/UPDATE/DELETE），该表所有缓存都会失效。

由于高并发下缓存命中率低、维护成本高，MySQL 8.0 起已彻底移除查询缓存功能。

✅ 现代提议：应用层使用 Redis 等外部缓存替代。

第三站：解析器（Parser）

若无缓存（或缓存已废弃），SQL 进入解析阶段。

解析器做两件事：

词法分析：将 SQL 字符串拆解为一个个“词元”（Token），如 SELECT、name、FROM、users 等；
语法分析：根据 MySQL 语法规则，构建解析树（Parse Tree），验证 SQL 是否合法。

例如：

SELEC name FROM users; -- ❌ 拼写错误 → 报错 "You have an error in your SQL syntax"

第四站：预处理器（Preprocessor）

在某些版本中，解析后还会经过预处理器：

检查表和字段是否存在；
验证用户是否有访问权限（再次校验）；
解析别名、处理 * 展开等。

这一步确保语义正确性，为后续优化打下基础。

第五站：查询优化器（Optimizer）

这是 MySQL 最“机智”的部分！优化器决定如何高效执行 SQL。

面对同一查询，可能有多种执行路径：

先查表 A 再关联表 B？
使用哪个索引？
是否需要临时表或排序？

优化器会：

分析统计信息（如表行数、索引基数）；
估算不同执行计划的“成本”（Cost）；
选择成本最低的执行方案。

最终输出一个执行计划（Execution Plan）。

查看执行计划：EXPLAIN SELECT name FROM users WHERE id = 100;

示例输出：

+----+-------------+-------+------------+-------+---------------+---------+---------+-------+------+----------+-------+
| id | select_type | table | partitions | type  | possible_keys | key     | key_len | ref   | rows | filtered | Extra |
+----+-------------+-------+------------+-------+---------------+---------+---------+-------+------+----------+-------+
|  1 | SIMPLE      | users | NULL       | const | PRIMARY       | PRIMARY | 4       | const |    1 |   100.00 | NULL  |
+----+-------------+-------+------------+-------+---------------+---------+---------+-------+------+----------+-------+

这里显示使用了主键索引（PRIMARY），类型为 const（最快）。

第六站：执行器（Executor）

有了执行计划，执行器开始真正干活！

它的核心任务：

调用存储引擎接口，按计划读取数据；
逐行过滤、计算、返回结果；
处理事务、锁、日志等机制。

以我们的例子为例：

SELECT name, age FROM users WHERE id = 100;

执行器会：

调用 InnoDB 引擎，通过主键索引查找 id = 100 的记录；
InnoDB 返回对应行数据；
执行器检查字段权限（如用户是否有权读 age）；
提取 name 和 age 字段；
将结果返回给客户端。

⚠️ 注意：即使你只查两个字段，InnoDB 仍可能读取整行（除非使用覆盖索引）。

第七站：存储引擎（Storage Engine）——以 InnoDB 为例

MySQL 是“插件式”架构，存储引擎负责实际的数据存储与读写。

InnoDB（默认引擎）在此过程中：

根据主键在 B+ 树中定位记录；
若存在行锁，可能等待或冲突；
从缓冲池（Buffer Pool）中读取数据（若不在内存，则从磁盘加载）；
返回数据给执行器。

关键点：执行器不关心数据怎么存，只调用统一接口；存储引擎不关心 SQL 逻辑，只负责数据 I/O。

补充：写操作（INSERT/UPDATE/DELETE）的额外步骤

如果是写 SQL，流程类似，但多了关键环节：

写 redo log（重做日志）：保证崩溃恢复；
写 undo log（回滚日志）：支持事务回滚和 MVCC；
修改 Buffer Pool 中的数据页；
后台线程异步刷盘（Checkpoint）。

这就是 InnoDB 实现 ACID 和 崩溃安全 的核心机制。

总结：SQL 执行全景图

面试加分点

强调分层架构：连接、解析、优化、执行、存储解耦；
理解优化器作用：不是“怎么查”，而是“怎么查最快”；
知道缓存已废弃：体现对新版 MySQL 的了解；
提及执行计划：EXPLAIN 是性能调优入口；
区分 Server 层与引擎层：执行器 vs InnoDB。

结语

一条看似简单的 SQL，背后是 MySQL 多个模块精密协作的结果。理解这个过程，不仅能写出更高效的查询，还能在排查慢 SQL、设计索引、优化架构时游刃有余。

下次面试官问：“说说 MySQL 执行一条 SQL 的过程”，你就可以自信地说：

“让我带你走一遍它的奇幻旅程……”

✨ 掌握原理，方能驾驭技术。

© 版权声明

文章版权归作者所有，未经允许请勿转载。

相关文章

「英语轻松学」《Dig Dig Dig》挖挖挖

「英语轻松学」《Dig Dig Dig》挖挖挖

4个月前

010

Ubuntu16.04安装CUDA10.2 + Nvidia驱动 + cuDNN 7.6.5.32 （2021.6更新）

Ubuntu16.04安装CUDA10.2 + Nvidia驱动 + cuDNN 7.6.5.32 （2021.6更新）

4个月前

010

朝阳社区芳泰工作站“百姓小课堂”第十二期又开课啦！

朝阳社区芳泰工作站“百姓小课堂”第十二期又开课啦！

4个月前

010

深入理解ThreadLocal：从原理到架构实践的全面解析

深入理解ThreadLocal：从原理到架构实践的全面解析

1个月前

020

1 条评论

您必须登录才能参与评论！

立即登录

小晶读者

收藏了，感谢分享

2个月前无记录

登录以回复