当前位置：首页 > news >正文

【MySQL】一篇讲懂什么是聚簇索引和非聚簇索引(二级索引)以及什么是回表？

news 2025/3/28 6:33:15

1.聚簇索引：

叶子节点直接存储了完整的数据行。

每个表只能有一个聚簇索引，通常是主键(Primary Key)。
如果没有定义主键，则MySQL会选择一个唯一且非空索引作为聚簇索引。

特点：

数据存储：叶子结点存储完整的数据行，因此数据和索引是存储在一起的。
查询效率：一次索引查询就能查到完整数据航。
排序：数据在物理上时按照聚簇索引的顺序存储的，因此范围查询非常(BETWEEN、>、<)高效。

举例：
请添加图片描述

2.非聚簇索引(也叫二级索引)：

叶子节点存储的是 索引字段的值+主键值，而不是完整的数据行。

一个表可以有多个非聚簇索引。
非聚簇索引需要通过主键值回到聚簇索引中查找完整的数据行，这个过程称为回表(下面详细介绍)。

特点：

数据存储：叶子结点存储的是索引字段值+主键值。而不是完整的数据行。
查询效率：通过非聚簇索引查找数据需要两次查找：1.通过非聚簇索引找到主键值。2.通过主键值回到聚簇索引中查找完整的数据行。
使用场景：适合查找条件中不包含主键的场景。

举例：
请添加图片描述

步骤1：通过非聚簇索引idx_name找到name='Bob’对应的主键值id=2。
步骤2：通过主键值id=2回到聚簇索引中查找完整的数据行，返回id=2,name=‘Bob’,age=30。

优缺点：

优点：
- 提高查询效率：加速基于非主键字段的查询。
- 支持多字段索引，可以创建联合索引。
缺点：
- 占用存储空间：每个二级索引都要额外的存储空间。
- 可能触发回表：如果查询字段不在二级索引中，需要回表，增加查询开销。

3.回表：

回表是指当用二级索引查询数据时，如果查询的字段不在二级索引中，MySQL需要通过二级索引找到主键值，然后再回到聚簇索引中查找完整的数据行。

4.为什么会出现回表？

通常发生在一下场景：
1.查询的字段不在二级索引中：

例如，select * 需要获取所有字段，但二级索引只包含部分字段(如name和id)，因此需要回表。
2.使用了ORDER BY或GROUP BY：
如果排序或分组的字段不在二级索引中，可能需要回表来获取完整的数据行。

5.如何避免回表？

5.1使用覆盖索引：

覆盖索引：查询的字段都在二级索引中，可以直接从二级索引中获取数据，而不需要回表。

SELECT id, name FROM users WHERE name = 'Alice';

id 和 name 都在二级索引 idx_name 中，因此不需要回表。

5.2优化索引设计

确保常用的查询字段都在索引中。

CREATE TABLE users (id INT PRIMARY KEY,name VARCHAR(100),age INT,KEY idx_name_age (name, age)  -- 联合索引
);

如果查询name和age，可以使用联合索引，避免回表。

5.3减少SELECT *的使用

查看全文

http://www.mrgr.cn/news/95748.html

基于PySide6的CATIA自动化工具开发实战——空几何体批量清理系统

矩阵补充，最近邻查找

流程控制语句

【渗透测试】Fastjson 反序列化漏洞原理（一）

算法训练营第二十三天 | 贪心算法（一）

GithubPages+自定义域名+Cloudfare加速+浏览器收录（2025最新排坑）

内核中的互斥量

UE4学习笔记 FPS游戏制作17 让机器人持枪销毁机器人时也销毁机器人的枪让机器人射击

Linux修改SSH端口号

研究生入学前文献翻译训练

揭秘大数据 | 12、大数据的五大问题之大数据管理与大数据分析

V8引擎源码编译踩坑实录

测试：测试中的概念

【LeetCode 题解】算法：3. 无重复字符最长子串问题

Flink 自定义数据源：从理论到实践的全方位指南

Android RemoteViews：跨进程 UI 更新的奥秘与实践

【性能优化点滴】odygrd/quill 中一个简单的标记位作用--降低 IO 次数

python打包辅助工具

数据库基础知识点（系列二）

Docker-Compose部署 EasySearch 异常问题排查