数据库系列课程（10）-MySQL索引实现原理

1. 引言

MySQL官方对索引的定义为：索引（Index）是帮助 MySQL 高效获取数据的数据结构。

白话文：索引就像书的目录一样可以非常快速的定位到书的页码。

如果向mysql发出一条sql语句请求，查询的字段没有创建索引的话，可能会导致全表扫描，这样的话查询效率非常低。

那么MySQL中索引采用的是那些数据结构？或者说索引实现的原理。下面来举例讲解。

2. 索引实现的原理

2.1 方式一：数据结构Hash算法

哈希表（Hash table，也叫散列表），是根据关键码值(Key value)而直接进行访问的数据结构。也就是说，它通过把关键码值映射到表中一个位置来访问记录，以加快查找的速度。这个映射函数叫做散列函数，存放记录的数组叫做散列表。

优点: 查找可以直接根据key访问(index=Hash(key))

缺点: 不能进行范围查找

2.2 方式二：平衡二叉树算法

平衡二叉查找树，又称 AVL树。它除了具备二叉查找树的基本特征之外，还具有一个非常重要的特点：它的左子树和右子树都是平衡二叉树，且左子树和右子树的深度之差的绝对值（平衡因子）不超过1。也就是说AVL树每个节点的平衡因子只可能是-1、0和1（左子树高度减去右子树高度）。
在这里插入图片描述
优点: 平衡二叉树算法基本与二叉树查询相同，效率比较高。

缺点:插入操作需要旋转，支持范围查询。

2.3 方式三：数据结构B树

维基百科对B树的定义为“在计算机科学中， B树（B-tree） 是一种树状数据结构，它能够存储数据、对其进行排序并允许以O(log n)的时间复杂度运行进行查找、顺序读取、插入和删除的数据结构。B树，概括来说是一个节点可以拥有多于2个子节点的二叉查找树。与自平衡二叉查找树不同，B-树为系统最优化大块数据的读和写操作。B-tree算法减少定位记录时所经历的中间过程，从而加快存取速度。普遍运用在数据库和文件系统。”

因为B树节点元素比平衡二叉树要多，所以B树数据结构相比平衡二叉树数据结构实现减少磁盘IO的操作。
在这里插入图片描述