攻克MySQL—索引优化

0. 引子

在上一篇文章中，我们学习了索引的概念、使用场景、常用的数据结构、InnoDB引擎的数据结构——B+树，以及MySQL中的各种索引的分类，例如主键索引、二级索引、普通索引、唯一索引等等。

仅仅了解这些概念，还不足以让我们在工作或面试中游刃有余，原因在于有几个点我们没有讨论：

对于如何创建良好的索引？

如何合理地使用索引？

索引是不是一本万利，可以使用的免费午餐？

本文会针对上面这些问题，做进一步的总结。

1. 索引的代价 1.1 维护代价

每张MySQL的表都会有一个主键索引（没有指定主键的话，引擎本身也会默认用rowId作为主键），因此在一张MySQL的表中至少有一棵B+树。如果开发者再创建 N 个二级索引，就需要再创建N棵B+树，新增数据时不仅要修改主键索引，还需要修改这N个二级索引。

1.2 空间代价

虽然二级索引不保存原始数据，但要保存索引列的数据，所以会占用更多的空间。

使用下面的命令初始化本文的测试数据：

CREATE TABLE `tuser` (
  `id` int(11) NOT NULL,
  `id_card` varchar(32) DEFAULT NULL,
  `name` varchar(32) DEFAULT NULL,
  `age` int(11) DEFAULT NULL,
  `ismale` tinyint(1) DEFAULT NULL,
  PRIMARY KEY (`id`),
  KEY `id_card` (`id_card`),
  KEY `name_age` (`name`,`age`)
) ENGINE=InnoDB;


insert into tuser values(1,'78967ydydyd','阿杜',18,1);
insert into tuser values(2,'789kdkdkdkdkydydyd','哈哈',20,0);
insert into tuser values(3,'789kdkdkdkdkjdjdjdjdjj','测试'17,1);

例子1：通过下面的命令可以看出，原始的数据大小只有16384，但是索引空间用了32768。

SELECt DATA_LENGTH, INDEX_LENGTH FROM information_schema.TABLES WHERe TABLE_NAME='tuser';

2. 合理使用索引 2.1 主键索引

在非KV场景下，最好创建一个代理键作为主键，这种主键的数据应该和应用业务无关（业务数据一般很难保障顺序插入），最简单的方式就是使用AUTO_INCREMENT自增列。这样可以保障数据行是按顺序插入的，可以极大减少页的分裂和碎片。

从性能方面考虑，使用UUID作为主键，有下面这些缺点

随机IO：写入的目标页可能已经刷到磁盘上，并从缓存中删除，或者还没有被加载到缓存中，在写入之前需要先将目标页读取到缓存中；

分裂次数增加：因为写入是乱序的，InnoDB不得不为新插入的数据挪动空间，移动的时候需要不断调整B+树的结构

由于频繁的的页分裂，页的空间使用率会比较差，充满碎片

从存储空间方面考虑，UUID的字段长度长于自增ID，导致本身的主键索引空间变大，另外二级索引的叶子节点中存放的也是主键索引的ID，因此二级索引的占用空间也会变大。

攻克MySQL—索引优化

Java相关栏目本月热门文章