AVL树/高度平衡二叉搜索树
map/multimap/set/multiset其底层都是按照二叉搜索树来实现的,但是二叉搜索树有其自身的缺陷,假如往树中插入的元素有序或者接近有序,二叉搜索树就会退化成单支树,时间复杂度会退化成O(N),因此map、set等关联式容器的底层结构是对二叉树进行了平衡处理,即采用平衡树来实现。
概念
向二叉搜索树中插入新结点,保证每个结点的左右子树高度之差的绝对值不超过1(需要对树中的结点进行调整),即可降低树的高度,从而减少平均搜索长度。
一棵AVL树或者是空树,或者是具有以下性质的二叉搜索树:
- 它的左右子树都是AVL树。
- 左右子树高度之差(简称平衡因子)的绝对值不超过1(-1/0/1)。
如果一棵二叉搜索树是高度平衡的,它就是AVL树。如果它有n个结点,其高度可保持在 O ( l o g 2 n ) O(log_2 n) O(log2n),搜索时间复杂度O( l o g 2 n log_2 n log2n)。
AVL树就是在二叉搜索树的基础上引入了平衡因子,平衡因子是用来评估这棵树的状态
代码实现
节点定义
这里用三叉链
template<class K, class V>
struct AVLTreeNode
{
pair<K, V> _kv;//键值对
int _bf;//平衡因子balance factor
//三叉链
AVLTreeNode<K, V>* _left;
AVLTreeNode<K, V>* _right;
AVLTreeNode<K, V>* _parent;
AVLTreeNode(const pair<K, V>& kv)
: _kv(kv)
, _bf(0)
, _left(nullptr)
, _right(nullptr)
, _parent(nullptr)
{}
};
插入
按照二叉搜索树的方式插入新节点,再调整节点的平衡因子。
平衡因子更新的方法
cur插入后,parent的平衡因子一定需要调整,在插入之前,parent的平衡因子分为三种情况:-1,0, 1, 分以下2种情况:
A.如果cur插入到parent的左侧,只需给parent的平衡因子-1即可
B.如果cur插入到parent的右侧,只需给parent的平衡因子+1即可,此时:parent的平衡因子可能有三种情况:0,±1, ±2
1. 如果parent的平衡因子为0,说明插入之前parent的平衡因子为±1(原子树一边高一边低),插入后被调整成0(补上了矮的那边,现子树两边一样高),此时满足AVL树的性质,插入成功,无需向上更新
2. 如果parent的平衡因子为±1,说明插入前parent的平衡因子一定为0(原子树两边一样高),插入后被更新成±1(现子树一边高一边低),此时以parent为根的树的高度增加,需要继续向上更新
3. 如果parent的平衡因子为±2,则parent的平衡因子违反平衡树的性质,需要对其进行旋转处理,需满足如下要求:a.让这颗子树左右高度差不超过1;b.旋转过程中继续保持他是搜索树;c.更新调整孩子节点的平衡因子;d. 让这颗子树的高度跟插入前保持一致。若不会继续影响上层,更新旋转结束
旋转的方法
- 较高左子树==>
parent->_bf == -2
- 较高右子树==>
parent->_bf == 2
- 插入在左侧==>
cur->_bf == -1
- 插入在右侧==>
cur->_bf == 1
根据节点插入位置的不同,AVL树的旋转分为四种:
1、新节点插入较高右子树的右侧—右右:左单旋
if (parent->_bf == 2 && cur->_bf == 1)
{
RotateL(parent);
}
void RotateL(Node* parent)
{
Node* subR = parent->_right;
Node* ppNode = parent->_parent;
Node* subRL = subR->_left;
if(subRL)
subRL->_parent = parent;
parent->_right = subRL;
subR->_left = parent;
parent->_parent = subR;
if (ppNode == nullptr)
{
_root = subR;
_root->_parent = nullptr;
}
else
{
subR->_parent = ppNode;
if (ppNode->_left == parent)
{
ppNode->_left = subR;
}
else
{
ppNode->_right = subR;
}
}
parent->_bf = subR->_bf = 0;
}
2、新节点插入较高左子树的左侧—左左:右单旋
if (parent->_bf == -2 && cur->_bf == -1)
{
RotateR(parent);
}
void RotateR(Node* parent)
{
Node* ppNode = parent->_parent;
Node* subL = parent->_left;
Node* subLR = subL->_right;
if (subLR)
subLR->_parent = parent;
parent->_left = subLR;
subL->_right = parent;
parent->_parent = subL;
if (ppNode == nullptr)
{
_root = subL;
_root->_parent = nullptr;
}
else
{
subL->_parent = ppNode;
if (ppNode->_left == parent)
{
ppNode->_left = subL;
}
else
{
ppNode->_right = subL;
}
}
parent->_bf = subL->_bf = 0;
}
3、新节点插入较高左子树的右子树的(右子树自己/右子树的左侧/右子树的右侧)—左右:左右双旋,先左单旋再右单旋
if (parent->_bf == -2 && cur->_bf == 1)
{
RotateLR(parent);
}
void RotateLR(Node* parent)
{
Node* subL = parent->_left;
Node* subLR = subL->_right;
int bf = subLR->_bf;
RotateL(parent->_left);
RotateR(parent);
if (bf == -1)
{
//表示subLR的左子树新增节点
subLR->_bf = 0;
subL->_bf = 0;
parent->_bf = 1;
}
else if (bf == 1)
{
//表示subLR的右子树新增节点
subLR->_bf = 0;
subL->_bf = -1;
parent->_bf = 0;
}
else if (bf == 0)
{
//表示subLR自己就是新增节点
subLR->_bf = 0;
subL->_bf = 0;
parent->_bf = 0;
}
else
{
assert(false);
}
}
4、新节点插入较高右子树的左子树的(左子树自己/左子树的左侧/左子树的右侧)—右左:右左双旋,先右单旋再左单旋
if (parent->_bf == 2 && cur->_bf == -1)
{
RotateRL(parent);
}
void RotateRL(Node* parent)
{
Node* subR = parent->_right;
Node* subRL = subR->_left;
int bf = subRL->_bf;
RotateR(parent->_right);
RotateL(parent);
if (bf == 1)
{
subR->_bf = 0;
subRL->_bf = 0;
parent->_bf = -1;
}
else if (bf == -1)
{
subR->_bf = 1;
subRL->_bf = 0;
parent->_bf = 0;
}
else if (bf == 0)
{
subR->_bf = 0;
subRL->_bf = 0;
parent->_bf = 0;
}
else
{
assert(false);
}
}
删除
过程比插入更复杂。删除节点后如果父节点的平衡因子变成0,就要更新平衡因子;如果平衡因子变成±1,就不用向上更新。最差情况要一直调整到根节点的位置。
性能
AVL树是一棵绝对平衡的二叉搜索树,其要求每个节点的左右子树高度差的绝对值都不超过1,这样可以保证查询时高效的时间复杂度,即 l o g 2 ( N ) log_2 (N) log2(N)。但是如果要对AVL树做一些结构修改的操作,性能非常低下,比如:插入时要维护其绝对平衡,旋转的次数比较多,更差的是在删除时,有可能一直要让旋转持续到根的位置。
因此如果需要一种查询高效且有序的数据结构,而且数据的个数为静态的(即不会改变),可以考虑AVL树;但一个结构经常修改,就不适合用AVL树来管理。