B树与B+详解

承接上篇SQLite采用B树结构使得SQLite内存占用资源较少,本篇将讲述B树的具体操作(建树,插入,删除等操作)。在看博客时,建议拿支笔和纸,一点一点操作,毕竟知识是自己的,自己也要消化的。本篇通读下来,大约需要25-35分钟,关键掌握B树的具体操作思想,欢迎大家指正。

一、前言

动态查找树主要包括:二叉查找树,平衡二叉树,红黑树,B树,B-树,查找的时间复杂度就为O(log2N),通过对数就可以发现降低树的深度就会提高查找效率。在大数据存储过程,大量的数据会存储到外存磁盘,外存磁盘中读取与写入某数据的时候,首先定位到磁盘中的某一块,这就有个问题:如何才能有效的查找磁盘中的数据呢,这就需要一种高效的外存数据结构,也就引出了下面的课题。

B树为了存储设备或者磁盘而设计的一种平衡查找树,与红黑树类似(拓展会讲)。

拓展:

B树与红黑树的

不同在于:B树的节点可以有很多子女,从几个到几万个不等,

相同:一颗含有n个节点的B树高度和红黑树是一样的,都是O(lgn)。

二、定义

1.B树

(1)一棵m阶的B树,特性如下:

利用书面的定义(参考书籍-《数据结构》)

1)树中的每个结点最多含有m个孩子;

2)除了根结点和叶子结点,其他结点至少有[ceil(m / 2)(代表是取上限的函数)]个孩子;

3)若根结点不是叶子结点时,则至少有两个孩子(除了没有孩子的根结点)

4)所有的叶子结点都出现在同一层中,叶子结点不包含任何关键字信息;

(2)B树的类型与节点定义

#define m  1024
struct BTNode;
typedef struct BTNode *PBTNode;
struct BTNode {
    int keyNum;//实际关键字个数,keyNum < m
    PBTNode parent;//指向父亲节点
    PBTNode *ptr;
    keyType *key;//关键字向量
    
}

typedef struct BTNode *BTree;
typedef BTree *PBTree;

2.B+树

B+树可以说是B树的一种变形,它把数据都存储在叶结点,而内部结点只存关键字和孩子指针,因此简化了内部结点的分支因子,B+树遍历也更高效,其中B+树只需所有叶子节点串成链表这样就可以从头到尾遍历,其中内部结点是并不存储信息,而是存储叶子结点的最小值作为索引,下面将讲述到。

定义:参考数据《数据结构》与百度百科

B+树用于数据库和文件系统中,NTFS等都使用B+树作为数据索引,

1)有n棵子树的结点含有n-1个关键字,每个关键字都不会保存数据,只会用来索引,并且所有数据都会保存在叶子结点;

2)所有的叶子结点包含所有关键字信息以及指向关键字记录的指针,关键字自小到大顺序连接;

参考下图(来自百度百科)

三、问答

1.为什么说B+树比B树更适合做操作系统的数据库索引和文件索引?

(1)B+树的磁盘读写的代价更低

B+树内部结点没有指向关键字具体信息的指针,这样内部结点相对B树更小。

(2)B+树的查询更加的稳定

因为非终端结点并不是最终指向文件内容的结点,仅仅是作为叶子结点中关键字的索引。这样所有的关键字的查找都会走一条从根结点到叶子结点的路径。所有的关键字查询长度都是相同的,查询效率相当。

四、B树与B+树操作(建议大家找张纸,跟着一起,毕竟知识是自己的)

1.B树

1.1 B树的插入

B树的插入是指插入一条记录,如果B树已存在需要插入的键值时,用新的值替换旧的值;若B树不存在这个值时,则是在叶子结点进行插入操作。

对高度为h的m阶B树,新结点一般插第h层。通过检索可以确定关键码应插入的位置,

1)若该结点中关键码个数小于m-1,则直接插入就可

2)若该结点中关键码个数等于m-1,则将引起结点的分裂,以中间的关键码为界将结点一分为二,产生了一个新的结点,并将中间关键码插入到父结点中;

重复上述过程,最坏情况一直分裂到根结点, 建立一个新的根结点,整个B树就增加一层。

举例如下:

》〉》〉下面以5阶B树举例,根据B树的定义,结点最多有4个值,最少有2个值。

a)在空树插入39,此时就有一个值,根结点也是叶子结点

b)继续插入22,97和41值,根结点变为4个值,符合要求

c)插入53值

插入之后发现超过结点最多只有4个值,所以要以中间值进行分开,分开后当前结点要指向父结点,分裂之后,发现符合要求

d)插入13,21,40,同样造成分裂,

e)紧接着插入30,27,33,36,24,34,35

f)将26再次插入进去

发现有5个值,超过B树的定义,需要以27为中心分裂,27进军父结点

发现父结点也超过4个,再次分裂

g)最后插入17,28,29,31,32的记录

1.2 B树的删除

B树删除:首先要查找该值是否在B树中存在,如果存在,判断该元素是否存在左右孩子结点,如果有,则上移孩子结点中的相近结点(左孩子最右边的结点或者有孩子最左边的结点)到父结点中,然后根据移动之后的情况;如果没有,进行直接删除;如果不存在对应的值,则删除失败。

1)如果当前要删除的值位于非叶子结点,则用后继值覆盖要删除的值,再用后继值所在的分支删除该后继值。(该后继值必须位于叶子结点上)

2)该结点值个数不小于Math.ceil(m/2)-1(取上线函数),结束删除操作,否则下一步

3)如果兄弟结点值个数大于Math.ceil(m/2)-1,则父结点中下移到该结点,兄弟的一个值上移,删除操作结束。

将父结点的key下移与当前的结点和他的兄弟姐妹结点key合并,形成一个新的结点,

有些结点可能有左兄弟,也有右兄弟,我们可以任意选择一个兄弟结点即可。

》〉》〉下面以5阶B树举例进行删除,根据B树的定义,结点最多有4个值,最少有2个值。

a)原始状态

b)在上面的B树删除21,删除之后结点个数大于等于2,所以删除结束

c)删除27之后为

27处于非叶子结点,用27的后继替换。也即是28替换27,然后在右孩子结点删除28,如上。

发现删除,当前叶子结点的记录的个数已经小于2,而兄弟结点中有3个记录我们可以从兄弟结点中借取一个key,父结点中的28就下移,兄弟结点中的26就上移,删除结束,结果如下

d)删除32

删除之后发现,当前结点中有key,而兄弟都有两个key,所以只能让父结点的30下移到和孩子一起合并,成为新的结点,并指向父结点,经拆封发现符合要求

2.B+树

2.1 B+树的插入

B+树插入:

1)若为空树,直接插入,此时也就是根结点

2)对于叶子结点:根据key找叶子结点,对叶子结点进行插入操作。插入后,如果当前结点key的个数不大于m-1,则插入就结束。反之将这个叶子结点分成左右两个叶子结点进行操作,左叶子结点包含了前m/2个记录,右结点包含剩下的记录key,将第m/2+1个记录的key进位到父结点中(父结点必须是索引类型结点),进位到父结点中的key左孩子指针向左结点,右孩子指针向右结点。

3)针对索引结点:如果当前结点key的个数小于等于m-1,插入结束。反之将这个索引类型结点分成两个索引结点,左索引结点包含前(m-1)/2个数据,右结点包含m-(m-1)/2个数据,然后将第m/2个key父结点中,进位到父结点的key左孩子指向左结点, 父结点的key右孩子指向右结点。

》〉》〉下面以5阶B+树举例进行插入,根据B+树的定义,结点最多有4个值,最少有2个值。

a)空树插入5,8,10,15

b)插入16

超过了最大值4,所以分裂,以中间为准

c)插入17,18

结点的关键字等于5,大于4,进行分裂。

符合条件,插入完成。

2.2 B+树删除

 

》〉》〉下面以5阶B+树举例进行删除,根据B+树的定义,结点最多有4个值,最少有2个值。

下面是初始状态

a)删除22,删除后个数为2,删除结束

b)删除15,结果如下:

删除之后,只有一个值,而兄弟有三个值,所以从兄弟结点借一个关键字,并更新索引结点

大家可以考虑删除7.我在这里直接给出结果

以上就是B树和B+树的操作,建议大家拿支笔操作一下,毕竟提高能力是没有错的。

五、代码实现

//测试程序1  
#include <iostream>  
#include <cstdlib>  
#include <ctime>  
#include "BTree.h"  
using namespace std;  
  
int main()  
{     
    char iKey[] = {'C','N','G','A','H','E','K','Q','M','F','W','L','T','Z','D','P','R','X','Y','S'};  
    char dKey[] = {'C','N','G','A','H','E','K','Q','M','F','W','L','T','Z','D','P','R','X','Y','S'};  
    int iSize = sizeof(iKey)/sizeof(char);  
    int dSize = sizeof(dKey)/sizeof(char);  
  
    int i;  
    BTree<char> btree(5, NULL);     
    cout<<"----------插入测试----------"<<endl;  
    for(i = 0; i < iSize; i++) //插入测试  
    {  
        cout<<"插入"<<iKey[i]<<"以后"<<endl;  
        btree.Insert(iKey[i]);  
        btree.PrintBTree();  
    }  
    cout<<"----------删除测试----------"<<endl;  
    for(i = 0; i < dSize; i++) //删除测试  
    {  
        cout<<"删除"<<dKey[i]<<"以后"<<endl;  
        btree.Delete(dKey[i]);  
        btree.PrintBTree();  
    }  
    return 0;  
}
//测试程序2  
#include <iostream>  
#include <cstdlib>  
#include <ctime>  
#include "BTree.h"  
using namespace std;  
  
int main()  
{     
    srand((int)time(0));  
    const int iSize = 100000;  //插入次数   
    const int dSize = 100000;  //删除次数  
    const int num = 100;       //测试组数  
    int *iKey = new int[iSize];  
    int *dKey = new int[dSize];   
    int i, j;  
    for(j = 0; j < num; j++)  //测试组数,每次测试都是插入iSize次,删除dSize次  
    {  
        for(i = 0; i < iSize; i++)  //插入数据生成  
            iKey[i] = rand()%iSize;  
        for(i = 0; i < dSize; i++)  
            dKey[i] = rand()%iSize; //删除数据生成  
  
        int m = rand()%400 + 3;  //随机生成3阶到402阶  
        BTree<int> btree(m, NULL);      
        cout<<"----------第"<<j<<"组插入测试----------"<<endl;  
        for(i = 0; i < iSize; i++) //插入测试  
            btree.Insert(iKey[i]);  
        cout<<""<<j<<"组插入测试成功,为"<<m<<"阶B树"<<endl;  
        cout<<"----------第"<<j<<"组删除测试----------"<<endl;  
        for(i = 0; i < dSize; i++) //删除测试  
            btree.Delete(dKey[i]);  
        cout<<""<<j<<"组删除测试成功,为"<<m<<"阶B树"<<endl<<endl;  
    }  
    delete [] iKey;  
    delete [] dKey;  
    return 0;  
}  
  1 //BTree.h文件,由于使用了模板所以没法将声明与实现分离  
  2 #pragma once  
  3 #include <queue>  
  4 using namespace std;  
  5   
  6 //B树的结点定义  
  7 template <typename T>  
  8 struct BTreeNode  
  9 {  
 10     int num;               //关键字个数    
 11     T *K;                  //指向关键字数组  
 12     BTreeNode<T> *parent;  //指向父亲结点  
 13     BTreeNode<T> **A;      //指向孩子结点数组的指针  
 14     BTreeNode(int n, int m, BTreeNode<T>  *p)  
 15     {  
 16         num = n;  
 17         parent = p;  
 18         K = new T[m+1];           //最多有m-1个关键字,K0不用,Km用来当哨兵  
 19         A = new BTreeNode *[m+1]; //最多有m个分支,Am用来当哨兵  
 20         for(int i = 0; i <= m; i++)  
 21             A[i] = NULL;  
 22     }  
 23     ~BTreeNode()  
 24     {  
 25         delete [] K; K = NULL;    
 26         delete [] A; A = NULL;  
 27     }  
 28 };  
 29   
 30 //搜索结果的三元组定义  
 31 template <typename T>  
 32 struct Triple  
 33 {  
 34     BTreeNode<T> * node;  //关键字所在结点  
 35     int i;                //关键字下标位置  
 36     bool tag;             //搜索是否成功  
 37     Triple(BTreeNode<T> *nd, int pos, bool t)   
 38     { node = nd; i = pos; tag = t;}  
 39 };  
 40   
 41 //B树定义  
 42 template <typename T>  
 43 class BTree  
 44 {  
 45 public:  
 46     BTree();  
 47     BTree(int m , BTreeNode<T> * root);  
 48     ~BTree();  
 49     Triple<T> Search(const T& x); //搜索核心函数  
 50     bool Insert(const T& x);      //插入核心函数  
 51     bool Delete(const T& x);      //删除核心函数  
 52     void InsertKey(BTreeNode<T> *p, T k, BTreeNode<T> *a, int i);    //插入一个二元组(K,A)  
 53     void SpliteNode(BTreeNode<T> *p, T *k, BTreeNode<T> **a, int i); //分裂结点  
 54     void RightAdjust(BTreeNode<T> *p, BTreeNode<T> *q, int i);  //从右子女取关键字  
 55     void LeftAdjust(BTreeNode<T> *p, BTreeNode<T> *q, int i);   //从左子女取关键字  
 56     void LeftCompress(BTreeNode<T> *p, int i);  //往左移动1个位置  
 57     void RightCompress(BTreeNode<T> *p, int i); //往右移动1个位置  
 58     void MergeNode(BTreeNode<T> *p, BTreeNode<T> *q, BTreeNode<T> *pR, int i); //合并两个结点  
 59     void PrintBTree(); //打印B树  
 60 private:  
 61     int m_m;                //路数,即最大子树棵数  
 62     BTreeNode<T> *m_pRoot;  //B树的根结点  
 63 };  
 64 template<typename T>  
 65 BTree<T>::BTree() //默认构造函数  
 66 {  
 67     m_m = 5;         //默认是5阶  
 68     m_pRoot = NULL;  //根结点初始为空  
 69 }  
 70 template<typename T>  
 71 BTree<T>::BTree(int m , BTreeNode<T> * root)  
 72 {  
 73     m_m = m;        
 74     m_pRoot = root;  
 75 }  
 76 template<typename T>  
 77 BTree<T>::~BTree() //释放所有的空间  
 78 {  
 79     if(m_pRoot != NULL)  
 80     {  
 81         queue<BTreeNode<T> *> nodeQueue; //利用队列,按层次遍历B树  
 82         nodeQueue.push(m_pRoot);         //放入根结点  
 83         while(nodeQueue.size())  
 84         {  
 85             BTreeNode<T> * p = nodeQueue.front();  
 86             if(p->A[0] != NULL) //不是叶结点,需考虑子女结点的删除  
 87             {  
 88                 for(int i = 0; i <= p->num; i++)  
 89                     nodeQueue.push(p->A[i]);  
 90             }  
 91             nodeQueue.pop();  
 92             delete p;  
 93             p = NULL;  
 94         }  
 95     }  
 96 }  
 97 //函数功能: 查找关键字x是否在B树中  
 98 //函数参数: x为查找的关键字  
 99 //返回值:   一个Triple对象(node, i, tag),tag=true表示x等于结点r中的Ki;tag=false表示x不在树中,r是最后一个被搜索的结点  
100 template <typename T>  
101 Triple<T> BTree<T>::Search(const T &x)  
102 {  
103     int i = 0;  //下标  
104     BTreeNode<T> *p = m_pRoot, *q = NULL;  //用来保存当前结点和它的父结点  
105   
106     while(p != NULL) //一直检查到叶结点  
107     {  
108         //n, A0,(K1, A1), (K2, A2), ... (Kn, An)  
109         //确定i,使得Ki <= x < Ki+1,K[0]不放数据  
110         //下面这条语句当然也可以写成 for(i = 1; i <= n && x >= p->K[i]; i++)  
111         //但是为了与Ki <= x < Ki+1这个关系式统一,采用了下述写法,观察后面的程序,发现这样写还避免了下标溢出的判断   
112         int n = p->num;   //当前结点的关键字个数     
113         for(i = 0; i < n && x >= p->K[i+1]; i++)  //可以改进一下,用二分查找  
114             ;  
115         if(x == p->K[i]) //是否已找到,不用判断下标,i最大为n   
116             return Triple<T>(p, i, true);  
117         q = p;  
118         p = p->A[i];     //搜索下一层,Ki与Ki+1中间的指针  
119     }  
120     return Triple<T>(q, i, false); //x不在树中,找到了可以插入的结点位置  
121 }  
122 //函数功能: 插入关键字x到B树中  
123 //函数参数: x为插入的关键字  
124 //返回值:   插入是否成功  
125 template <typename T>  
126 bool BTree<T>::Insert(const T &x)  
127 {  
128     if(m_pRoot == NULL) //空树  
129     {  
130         m_pRoot = new BTreeNode<T>(1, m_m, NULL);  //新的根含有1个关键字  
131         m_pRoot->K[1] = x;    //根的关键字  
132         return true;  
133     }  
134   
135     Triple<T> triple = Search(x);     //检查是否已存在  
136     if(triple.tag == true) //x已在B树中  
137         return false;  
138   
139     BTreeNode<T> *p = triple.node, *q; //结点地址  
140     //构造插入的两元组(k,a) 其中k为关键字,a为右邻指针  
141     BTreeNode<T> *a = NULL;  
142     T k  = x;  
143     int i = triple.i;   
144   
145     while(1) //插入过程  
146     {  
147         if(p->num < m_m-1) //关键字个数未到达上限,可以直接插入  
148         {  
149             InsertKey(p, k, a, i); //(k, a)插入到位置(Ki, Ai)后面  
150             return true;  
151         }  
152         SpliteNode(p, &k, &a, i); //将p结点分裂成两个结点,一个结点仍为p,另外一个变为两元组(k,a),以便插入到父结点  
153         if(p->parent != NULL)     //父结点不为空  
154         {  
155             q = p->parent; //获得父结点  
156             for(i = 0; i < q->num && x >= q->K[i+1]; i++) //确定新的插入位置i  
157                 ;  
158             p = q;   //进入上一层  
159         }  
160         else  
161         {  
162             //已经到达了根,需要新建一个结点  
163             m_pRoot = new BTreeNode<T>(1, m_m, NULL);  //新的根含有1个关键字  
164             m_pRoot->K[1] = k; //新根的关键字  
165             m_pRoot->A[0] = p; //左指针  
166             m_pRoot->A[1] = a; //右指针  
167             p->parent = a->parent = m_pRoot; //更新左右指针的父结点  
168             return true;  
169         }  
170     }  
171 }  
172 //函数功能: 插入关键字x到B树中,这是实际的插入函数  
173 //函数参数: p指向插入关键字所在结点,k为插入的关键字,a为关键字的右邻,i为插入位置  
174 //返回值:   无  
175 template <typename T>  
176 void BTree<T>::InsertKey(BTreeNode<T> *p, T k, BTreeNode<T> *a, int i)  
177 {  
178     for(int j = p->num; j > i; j--) //将K[i],A[i]以后的元素都往后移一个位置  
179     {  
180         p->K[j + 1] = p->K[j];  
181         p->A[j + 1] = p->A[j];  
182     }  
183     p->num++;        //结点的关键字个数加1  
184     p->K[i + 1] = k; //插入两元组在K[i],A[i]以后  
185     p->A[i + 1] = a;  
186     if(a != NULL)    //若为为空,需更新父结点指针  
187         a->parent = p;  
188 }  
189 //函数功能: 分裂结点  
190 //函数参数: p指向要分裂的结点,k指向插入的关键字,a指向关键字的右邻,i为插入位置  
191 //返回值:   无  
192 template <typename T>  
193 void BTree<T>::SpliteNode(BTreeNode<T> *p, T *k, BTreeNode<T> **a, int i)  
194 {  
195     InsertKey(p, *k, *a, i); //先插了再说  
196     int mid = (m_m + 1)/2;   //[ceil(m/2)]  
197     int size = (m_m & 1)? mid : mid + 1; //奇偶性决定了分裂时拷贝的关键字个数  
198   
199     BTreeNode<T> *q = new BTreeNode<T>(0, m_m, p->parent); //新结点  
200     //将p的K[mid+1...m]和A[mid..m]移到q的K[1...mid-1]和A[0...mid-1]  
201     q->A[0] = p->A[mid];  
202     for(int j = 1; j < size; j++)  
203     {  
204         q->K[j] = p->K[mid + j];    
205         q->A[j] = p->A[mid + j];    
206     }  
207     //修改q中的子女的父结点为q,这里很重要,因为这些子女原来的父结点为p  
208     if(q->A[0] != NULL)  
209     {     
210         for(int j = 0; j < size; j++)  
211             q->A[j]->parent = q;  
212     }  
213     //更新结点的关键字个数  
214     q->num = m_m - mid;  //结点q:m –[ceil(m/2)], A[ceil(m/2)],(K [ceil(m/2)]+1, A [ceil(m/2)]+1), …, (Km, Am)  
215     p->num = mid - 1;    //结点p:[ceil(m/2)]–1, A0, (K1, A1), (K2,A2), …, (K[ceil(m/2)]–1, A[ceil(m/2)]–1)   
216     //构建新的两元组(k,a)  
217     *k = p->K[mid];  
218     *a = q;  
219 }  
220   
221 //函数功能: 删除关键字x  
222 //函数参数: x为要删除的关键字  
223 //返回值:   删除是否成功  
224 template <typename T>  
225 bool BTree<T>::Delete(const T& x)  
226 {  
227     Triple<T> triple = Search(x); //检查是否已存在  
228     if(triple.tag == false)       //x不在B树中  
229         return false;  
230     BTreeNode<T> *p = triple.node, *q; //要删除的关键字所在结点  
231     int i = triple.i;  
232   
233     if(p->A[i] != NULL) //非叶结点  
234     {  
235         q = p->A[i];    //找右子树的最小关键码  
236         while(q->A[0] != NULL)  
237             q = q->A[0];  
238         p->K[i] = q->K[1];   //用叶结点替换  
239         LeftCompress(q, 1);  //删除K[1],其实只是用后面的结点覆盖一下即可  
240         p = q;               //转换为叶结点的删除  
241     }  
242     else  
243         LeftCompress(p, i);  //叶结点直接删除,其实只是用后面的结点覆盖一下即可  
244   
245     int mid = (m_m + 1) / 2; //求[ceil(m/2)]  
246     //下面开始调整  
247     while(1)  
248     {  
249         if(p == m_pRoot || p->num >= mid-1) //情形1和情形2  
250             break;  
251         else  
252         {  
253             q = p->parent; //父亲结点  
254             for(i = 0; i <= q->num && q->A[i] != p; i++) //找到p在父结点中的位置Ai  
255                 ;  
256             if(i == 0)     //p为最左指针  
257                 RightAdjust(p, q, i);  //结点p、父结点q、p的右兄弟结点进行旋转调整  
258             else  
259                 LeftAdjust(p, q, i);   //结点p、父结点q、p的左兄弟结点进行旋转调整  
260             p = q;         //向上调整  
261         }  
262     }  
263     if(m_pRoot->num == 0) //一颗空树  
264     {  
265         p = m_pRoot->A[0];  
266         delete m_pRoot;  
267         m_pRoot = p;  
268         if(m_pRoot != NULL)  
269             m_pRoot->parent = NULL;  
270     }  
271     return true;  
272 }  
273 //函数功能: 通过右子女调整,如果右子女有多余结点,从右子女取一个关键字  
274 //函数参数: p指向被删除的关键字所在结点,q指向父结点,i为p在q中的位置  
275 //返回值:   无  
276 template <typename T>  
277 void BTree<T>::RightAdjust(BTreeNode<T> *p, BTreeNode<T> *q, int i)  
278 {  
279     BTreeNode<T> *pR = q->A[i+1];  //p的右兄弟  
280     if(pR->num >= (m_m+1)/2)       //情形3,兄弟有足够多的关键字,即至少还有[ceil(m/2)]  
281     {  
282         //调整p  
283         p->num++;                  //p的关键字个数加1  
284         p->K[p->num] = q->K[i+1];  //父结点相应关键码下移  
285         p->A[p->num] = pR->A[0];   //右兄弟最左指针移到p的最右  
286         if(p->A[p->num] != NULL)  
287             p->A[p->num]->parent = p;  //修改父结点,原来是pR  
288         //调整父结点  
289         q->K[i+1] = pR->K[1];      //右兄弟的最小关键码上移到父结点  
290         //调整右兄弟  
291         pR->A[0] = pR->A[1];       //右兄弟剩余关键字与指针前移  
292         LeftCompress(pR, 1);       //覆盖K[1],A[1],关键字个数减1,LeftCompress中自动会减1    
293     }  
294     else  
295         MergeNode(p, q, pR, i + 1);//情形4 (...p Ki+1 pR...)  
296 }  
297 //函数功能: 通过左子女调整,如果左子女有多余结点,从左子女取一个关键字  
298 //函数参数: p指向被删除的关键字所在结点,q指向父结点,i为p在q中的位置  
299 //返回值:   无  
300 template <typename T>  
301 void BTree<T>::LeftAdjust(BTreeNode<T> *p, BTreeNode<T> *q, int i)  
302 {  
303     BTreeNode<T> *pL = q->A[i-1]; //p的左兄弟  
304     if(pL->num >= (m_m+1)/2)      //情形3  
305     {  
306         //调整p  
307         RightCompress(p, 1);     //p的关键字和指针往右移动,空出位置放左子女的关键字,RightCompress会自动加1  
308         p->A[1] = p->A[0];     
309         p->K[1] = q->K[i];        //父结点相应关键码下移  
310         p->A[0] = pL->A[pL->num]; //左兄弟最右指针移到p的最左  
311         if(p->A[0] != NULL)  
312             p->A[0]->parent = p;      //修改父结点,原来是pL  
313         //调整父结点  
314         q->K[i] = pL->K[pL->num]; //左兄弟的最大关键码上移到父结点  
315         //调整左兄弟  
316         pL->num--;   //左兄弟的关键字个数减1  
317     }  
318     else  
319     {  
320         //左右互换一下,以符合合并函数的参数要求  
321         BTreeNode<T> *pR = p;  
322         p = pL;  
323         MergeNode(p, q, pR, i);   //情形4,注意这里i,而不是i+1 (...p Ki pR...)  
324     }  
325 }  
326 //函数功能: 将结点p自i+1开始的关键字和指针往左移动1,原来的K[i],A[i]其实被覆盖掉了  
327 //函数参数: p指向结点,i为被覆盖的位置  
328 //返回值:   无  
329 template <typename T>  
330 void BTree<T>::LeftCompress(BTreeNode<T> *p, int i)  
331 {  
332     int n = p->num;   //结点关键字个数  
333     for(int j = i; j < n; j++)  
334     {  
335         p->K[j] = p->K[j + 1];  
336         p->A[j] = p->A[j + 1];  
337     }  
338     p->num--; //关键字个数减1  
339 }  
340 //函数功能: 将结点p自i开始的关键字和指针往右移动1,原来的K[i],A[i]空出来了  
341 //函数参数: p指向结点,i为空出来的位置,用于放新的关键字  
342 //返回值:   无  
343 template <typename T>  
344 void BTree<T>::RightCompress(BTreeNode<T> *p, int i)  
345 {  
346     for(int j = p->num; j >= i; j--) //K[i],A[i]空出来用以放插入的二元组  
347     {  
348         p->K[j + 1] = p->K[j];  
349         p->A[j + 1] = p->A[j];  
350     }  
351     p->num++; //关键字个数加1  
352 }  
353 //函数功能: 合并两个结点  
354 //函数参数: p指向结点,q指向父亲,pR指向p的右兄弟,i为(...p,K,pR...)中的K位置  
355 //返回值:   无  
356 template <typename T>  
357 void BTree<T>::MergeNode(BTreeNode<T> *p, BTreeNode<T> *q, BTreeNode<T> *pR, int i)  
358 {  
359     int n = p->num + 1;   //p结点下一个放关键字的位置  
360     p->K[n] = q->K[i];    //下降父结点的关键字  
361     p->A[n] = pR->A[0];   //从右兄弟左移一个指针  
362     for(int j = 1; j <= pR->num; j++) //将右兄弟剩余关键字和指针移到p中  
363     {  
364         p->K[n + j] = pR->K[j];  
365         p->A[n + j] = pR->A[j];  
366     }  
367     if(p->A[0]) //修改p中的子女的父结点为p,这里很重要,因为这些子女原来的父结点为pR,与分裂相对  
368     {  
369         for(int j = 0; j <= pR->num; j++)  
370             p->A[n + j]->parent = p;  
371     }  
372     LeftCompress(q, i);            //父结点的关键字个数减1  
373     p->num = p->num + pR->num + 1; //合并后关键字的个数  
374     delete pR;  
375     pR = NULL;  
376 }  
377 //函数功能: 打印B树  
378 //函数参数: 无  
379 //返回值:   无  
380 template <typename T>  
381 void BTree<T>::PrintBTree()  
382 {  
383     if(m_pRoot != NULL)  
384     {  
385         queue<BTreeNode<T> *> nodeQueue; //利用队列  
386         nodeQueue.push(m_pRoot);         //放入根结点  
387         while(nodeQueue.size())  
388         {  
389             BTreeNode<T> * p = nodeQueue.front();  
390             if(p->A[0] != NULL) //非叶结点  
391             {  
392                 nodeQueue.push(p->A[0]);  //将子女结点的指针放入队列中  
393                 for(int i = 1; i <= p->num; i++)  
394                 {  
395                     nodeQueue.push(p->A[i]);  
396                     cout<<p->K[i]<<' ';  
397                 }  
398             }  
399             else  
400             {  
401                 for(int i = 1; i <= p->num; i++)  
402                     cout<<p->K[i]<<' ';  
403             }     
404   
405             if(p->parent) //打印父结点的第一个关键字  
406                 cout<<"-----First key of their parent:"<<p->parent->K[1]<<endl;  
407             else  
408                 cout<<endl;  
409             nodeQueue.pop();  
410         }  
411     }  
412 } 

可以直接运行,大家可以复制粘贴进行效果查看(算法思想很重要)

上面就是B树和B+树从概念到代码应用,B树从数据库引出的,讲完之后,也会重回数据库。下一篇将继续讲解针对SQLite进行封装的FMDB第三方的讲解并附带项目中实际使用。

欢迎大家指正。

猜你喜欢

转载自www.cnblogs.com/guohai-stronger/p/9225057.html