索引
索引用于快速找出某个列中有一特定值的行。
不使用索引,MySQL 必须从第 1 条记录开始读完整个表,直到找出相关的行。
表越大,查询数据所花费的时间越多。
如果表中查询的列有一个索引,MySQL 能快读到达某个位置去搜寻数据文件,而不必查看所有数据。
索引简介
索引是对数据库表中一列或多列的值进行排序的一种结构,使用索引可提高数据库中特定数据的查询速度
索引的定义和特点
索引是一个单独的、存储在磁盘上的数据库结构,包含着对数据表里所有记录的引用指针。
使用索引可以快速找出在某个或多个列中有一特定值的行,所有 MySQL 列类型都可以被索引,对相关列使用索引是提高查询操作速度的最佳途径
例如: 数据库中有 2 万条记录,现在要执行一个查询 SELECT * FROM table WHERE num = 10000
, 如果没有索引,就必须遍历整个表去查找 num = 10000 的行;
如果在 num 列上创建索引,MySQL 不需要任何扫描,直接在索引里找 10000,就可以得知这一行的位置。
可见,索引的建立可以提高数据库的查询速度
索引是在存储引擎中实现的,因此,每种存储引擎的索引都不一定完全相同,并且每种存储引擎也不一定支持所有索引类型。
根据存储引擎定义每个表的最大索引数和最大索引长度。
所有存储引擎支持每个表至少 16 个索引,总索引长度至少为 256 字节。大多数存储引擎有更高的限制。
MySQL 中索引的存储类型有两种,即 BTREE 和 HAH,具体和表的存储引擎相关;
MyISAM 和 InnoDB 存储引擎只支持 BTREE 索引;
MEMORY/HEAP 存储引擎可以支持 HASH 和 BTREE 索引
索引的优点主要有以下几条:
(1) 通过创建唯一索引,可以保证数据库表中每一行数据的唯一性
(2) 可以大大加快数据的查询速度,这也是创建索引的主要原因
(3) 在实现数据的参考完整性方面,可以加速表和表之间的连接
(4) 在使用分组和排序子句进行数据查询时,也可以显著减少查询中分组和排序的时间
增加索引也有许多不利的方面,主要表现在如下几个方面:
(1) 创建索引和维护索引要耗费时间,并且随着数据量的增加所耗费的时间也会增加。
(2) 索引需要占磁盘空间,除了数据表占数据空间之外,每一个索引还要占一定的物理空间,如果有大量的索引,索引文件可能比数据文件更快达到最大文件尺寸
(3) 当对表中的数据进行增加、删除和修改的时候,索引也要动态地维护,这样就降低了数据的维护速度
索引的分类
普通索引和唯一索引
普通索引是 MySQL 中的基本索引类型,允许在定义索引的列中插入重复值和空值
唯一索引要求索引列的值必须唯一,但允许有空值。
如果是组合索引,则列值的组合必须唯一。
主键索引是一种特殊的唯一索引,不允许有空值
单列索引和组合索引
单列索引即一个索引只包含单个列,一个表可以有多个单列索引
组合索引是指在表的多个字段组合上创建索引,只有在查询条件中使用了这些字段的左边字段时,索引才会被使用。
使用组合索引时遵循最左前缀集合
全文索引
全文索引类型为 FULLTEXT,在定义索引的列上支持值的全文查找,允许在这些索引列中插入重复值和空值。
全文索引可以在 CHAR、VARCHARR 或者 TEXT 类型的列上创建。
MySQL 只有 MyISAM 存储引擎支持全文索引
空间索引
空间索引是对空间数据类型的字段建立的索引,MySQL 中的空间数据类型有 4 种,分别是 GEOMETRY、POINT、LINESTRING 和 POLYGON。
MySQL 使用 SPATIAL 关键字进行扩展,使得能够用创建正规索引类似的语法创建空间索引。
创建空间索引的列,必须将其声明为 NOT NULL,空间索引只能在存储引擎为 MyISAM 的表中创建
索引的设计原则
索引设计不合理或者缺少索引都会对数据库和应用程序的性能造成障碍。
高效的索引对于获得良好的性能非常重要。设计索引时,应该考虑以下准则:
(1) 索引并非越多越好,一个表中如有大量的索引,不仅占用磁盘空间,还会影响 INSERT、DELETE、UPDATE 等语句的性能,因为在表中的数据更改时,索引也会进行调整和更新。
(2) 避免对经常更新的表进行过多的索引,并且索引中的列要尽可能少。应该经常用于查询的字段创建索引,但要避免添加不必要的字段
(3) 数据量小的表最好不要使用索引,由于数据较少,查询花费的时间可能比遍历索引的时间还要短,索引可能不会产生优化效果。
(4) 在条件表达式中经常用到的不同值较多的列上建立索引,在不同值很少的列上不要建立索引。比如在学生表的 "性别" 字段上只有 "男" 与 "女" 两个不同值,因此就无须建立索引,如果建立索引不但不会提高查询效率,反而会严重降低数据更新速度
(5) 当唯一性是某种数据本身的特征时,指定唯一索引。使用唯一索引能确保定义的列的数据完整性,以提高查询速度
(6) 在频繁进行排序或分组(即进行 GROUP BY 或 ORDER BY 操作)的列上建立索引,如果待排序的列有多个,可以在这些列上建立组合索引。
创建索引
MySQL 支持多种方法在单个或多个列上创建索引: 在创建表的定义语句 CREATE TABLE 中指定索引列,使用 ALTER TABLE 语句在存在的表上创建索引,或者使用 CREATE INDEX 语句在已存在的表上添加索引
创建表的时候创建索引
使用 CREATE TABLE 创建表时,除了可以定义列的数据类型,还可以定义主键约束、外键约束或者唯一性约束,而不论创建哪种约束,在定义约束的同时相当于在指定列上创建了一个索引。
创建表时创建索引的基本语法格式如下:
1 2 |
|
UNIQUE、FULLTEXT 和 SPATIAL 为可选参数,分别表示唯一索引、全文索引和空间索引;
INDEX 与 KEY 为同义词,两者作用相同,用来指定创建索引;
col_name 为需要创建索引的字段列,该列必须从数据表中定义的多个列中选择;
index_name 指定索引的名称,为可选参数,如果不指定,MySQL 默认 col_name 为索引值;
length 为可选参数,表示索引的长度,只有字符串类型的字段才能指定索引长度;
ASC 或 DESC 指定升序或者降序的索引值存储
创建普通索引
最基本的索引类型,没有唯一性之类的限制,其作用只是加快对数据的访问速度
例: 在 book 表中的 year_publication 字段上建立普通索引:
1 2 3 4 5 6 7 8 9 |
|
1 2 3 4 5 6 7 8 9 10 11 12 13 |
|
由结果可以看到,book 表的 year_publication 字段成功建立了索引,其索引名称 year_publication 为 MySQL 自动添加。
使用 EXPLAIN 语句查看索引是否正在使用
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 |
|
EXPLAIN 语句输出结果的各个行解释如下:
(1) select_type 行指定所使用的 SELECT 查询类型,这里值为 SIMPLE,表示简单的 SELECT,不使用 UNION 或子查询。其他可能的取值有 PRIMARY、UNION、SUBQUERY 等
(2) table 行指定数据库读取的数据表名字,它们被按读取的先后顺序排列
(3) type 行指定了本数据表与其他数据表之间的关联关系,可能的取值有 system、const、eq_ref、ref、range、index 和 All
(4) possible_keys 行给出了 MySQL 在搜索数据记录时可选用的各个索引
(5) key 行时 MySQL 实际选用的索引
(6) key_len 行给出索引按字节计算的长度,key_len 数据越小,表示越快。
(7) ref 行给出了关联表中另一个数据表里的数据列名
(8) rows 行是 MySQL 在执行这个查询时预计会从这个数据表里读出的数据行的个数
(9) Extra 行提供了与关联操作有关的信息。
可以看到,possible_keys 和 key 的值都为 year_publication,查询时使用了索引
创建唯一索引
创建唯一索引的主要原因是减少查询索引操作的执行时间,尤其是对比较庞大的数据表。
它与前面的普通索引类似,不同的就是: 索引列的值必须唯一,但允许有空值。
如果是组合索引,则列值的组合必须唯一
例: 创建一个表 t1,在表中的 id 字段上使用 UNIQUER 关键字创建唯一索引:
1 2 3 4 5 |
|
该语句执行完毕之后,使用 SHOW CREATE TABLE
查看表结构:
1 2 3 4 5 6 7 8 9 10 |
|
由结果可以看到,id 字段上已经成功建立了一个名为 UniqIdx 的唯一索引
创建单列索引
单列索引是在数据表中的某一个字段上创建的索引,一个表中可以创建多个单列索引。
例: 创建一个表 t2,在表中的 name 字段上创建单列索引:
1 2 3 4 5 |
|
1 2 3 4 5 6 7 8 9 10 |
|
由结果可以看到,id 字段上已经成功建立了一个名为 SingleIdx 的单列索引,索引长度为 20
创建组合索引
组合索引是在多个字段上创建一个索引
例: 创建表 t3,在表中的 id、name 和 age 字段上建立组合索引
1 2 3 4 5 6 7 |
|
1 2 3 4 5 6 7 8 9 10 11 12 |
|
由结果可以看到,id、name 和 age 字段上已经成功建立了一个名为 MultiIdx 的组合索引
组合索引可起几个索引的作用,但是使用时并不是随便查询哪个字段都可以使用索引,而是遵从 “最左前缀”: 利用索引中最左边的列集来匹配行,这样的列集称为最左前缀。
例如,这里由 id、name 和 age 3 个字段构成的索引,索引行中按 id、name、age 的顺序存放,索引可以搜索(id,name,age)、(id,name) 或者 id 字段组合。
如果列不构成索引最左面的前缀,那么 MySQL 不能使用局部索引,如(age)或者(name,age)组合则不能使用索引查询
在 t3 表中,查询 id 和 name 字段,使用 EXPLAIN 语句查看索引的使用情况:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 |
|
可以看到,查询 id 和 name 字段时,使用了名称 MultiIdx 的索引,如果查询 (name,age) 组合或者单独查询 name 和 age 字段,结果如下:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 |
|
此时,possible_keys 和 key 值为 NULL,并没有使用在 t3 表中创建的索引进行查询
创建全文索引
FULLTEXT 全文索引可以用于全文搜索。
只有 MyISAM 存储引擎支持 FULLTEXT 索引,并且只为 CHAR、VARCHAR 和 TEXT 列创建索引。
索引总是对整个列进行,不支持局部(前缀)索引。
例: 创建表 t4,在表中的 info 字段上建立全文索引,SQL 语句如下:
1 2 3 4 5 6 7 |
|
提示:
因为 MySQL 8.0 中默认存储引擎为 InnoDB,在这里创建表时需要修改表的存储引擎为 MyISAM,不然创建索引会出错
1 2 3 4 5 6 7 8 9 10 11 12 |
|
由结果可以看到,info 字段上已经成功建立了一个名为 FullTxtIdx 的 FULLTEXT 索引。
全文索引非常适合于大型数据集,对于小的数据集,它的用处比较小
创建空间索引
空间索引必须在 MyISAM 类型的表中创建,且空间类型的字段必须为空
例: 创建表 t5,在空间类型为 GEOMETRY 的字段上创建空间索引:
1 2 3 4 |
|
1 2 3 4 5 6 7 8 9 |
|
在已经存在的表上创建索引
在已经存在的表中创建索引,可以使用 ALTER TABLE 语句或者 CREATE INDEX 语句
使用 ALTER TABLE 语句创建索引
ALTER TABLE 创建索引的基本语法如下:
1 |
|
与创建表时创建索引的语法不同的时,在这里使用了 ALTER TABLE 和 ADD 关键字,ADD 表示向表中添加索引
例: 在 book 表中的 bookname 字段上建立名为 BkNameIdx 的普通索引:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 |
|
其中各个主要参数的含义为:
(1) Table 表示创建索引的表
(2) Non_unique 表示索引非唯一,1 代表是唯一索引,0 代表唯一索引
(3) Key_name 表示索引的名称
(4) Seq_in_index 表示该字段在索引中的位置,单列索引该值为 1,组合索引为每个字段在索引定义中的顺序
(5) Column_name 表示定义索引的列字段
(6) Sub_part 表示索引的长度
(7) Null 表示该字段是否能为空值
(8) Index_type 表示索引类型
可以看到,book 表中已经存在了一个索引,即前面已经定义的名称为 year_publication 索引,该索引为非唯一索引
下面使用 ALTER TABLE 在 bookname 字段上添加索引,SQL 语句如下:
1 |
|
使用 SHOW INDEX 语句查看表中的索引:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 |
|
可以看到,现在表中已经有了两个索引,另一个通过 ALTER TABLE 语句添加的名称为 BkNmaeIdx 的索引,该索引为非唯一索引,长度为 30
例: 在 book 表的 bookId 字段上建立名称为 UniqidIdx 的唯一索引:
1 |
|
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 |
|
可以看到 Non_unique 属性值为 0,表示名称为 UniqidIdx 的索引为唯一索引,创建唯一索引成功
例: 在 book 表的 comment 字段上建立单列索引:
1 |
|
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 |
|
可以看到,语句执行之后在 book 表的 comment 字段上建立了名称为 BkcmtIdx 的索引,长度为 50,在查询时,只需要检索前 50 个字符
例: 在 book 表的 authors 和 info 字段上建立组合索引
1 |
|
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 |
|
可以看到名称为 BkAuAndInfoIdx 的索引由两个字段组成,authors 字段长度为 30,在组合索引中的序号为 1,该字段不允许空值 NULL;info 字段长度为 50,在组合索引中的序号为 2,该字段可以为空值 NULL
例: 创建表 t6,在 t6 表上使用 ALTER TABLE 创建全文索引:
首先创建表 t6,语句如下:
1 2 3 4 |
|
1 |
|
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 |
|
可以看到,t6 表中已经创建了名称为 infoFTIdx 的索引,该索引在 info 字段上创建,类型为 FULLTEXT,允许空值
使用 CREATE INDEX 创建索引
CREATE INDEX 语句可以在已经存在的表上添加索引。
在 MySQL 中,CREATE INDEX 被映射到一个 ALTER TABLE 语句上,基本语法结构为:
1 |
|
可以看到 CREATE INDEX 语句和 ALTER INDEX 语句的语法基本一样,只是关键字不同
删除索引
MySQL 中删除索引使用 ALTER TABLE 或者 DROP INDEX 语句,两者可以实现相同的功能,DROP INDEX 语句在内部被映射到一个 ALTER TABLE 语句中。
使用 ALTER TABLE 删除索引
ALTER TABLE 删除索引的基本语法格式如下:
1 |
|
例: 删除 book 表中名称为 UniqidIdx 的唯一索引,SQL 语句如下:
1 |
|
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 |
|
提示:
使用 AUTO_INCREMENT 约束字段的唯一索引不能被删除
使用 DROP INDEX 语句删除索引
DROP INDEX 删除索引的基本语法格式如下:
1 |
|
例: 删除 book 表中名称为 BkAuAndInfoIdx 的组合索引:
1 |
|
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 |
|
提示:
删除表中的列时,如果要删除的列为索引的组成部分,则该列也会从索引中删除。
如果组成索引的所有列都被删除,则整个索引将被删除
专家解惑
疑问1: 索引对数据库性能如此重要,应该如何使用它?
为数据库选择正确的索引是一项复杂的任务。如果索引列较少,则需要的磁盘空间和维护开销都较少。
如果在一个大表上创建了多种组合索引,索引文件也会膨胀很快。
另一方面,索引较多可覆盖更多的查询。可能需要试验若干不同的设计,才能找到最有效的索引。
可以添加、修改和删除索引而不影响数据库架构或应用程序设计。
因此,应尝试多种不同的索引从而建立最优的索引
疑问2: 尽量使用短索引
对字符串类型的字段进行索引,如果可能,应该指定一个前缀长度。例如,有一个 CHAR(255) 的列,如果在前 10 个或 30 个字符内,多数值是唯一的,则不需要对整个列进行索引。
短索引不仅可以提高查询速度,还可以节省磁盘空间、减少 I/O 操作