O(N) 建树#
对于树状数组最基本的建树方式,就是每个点加值。
时间复杂度:O(NlogN)
代码实现
int tr[N]; // tr[] 存储树状数组数据
int a[N]; // a[] 存储原数组数据
int n; // 数列长度
int lowbit(int x) { return x & -x; }
void add(int x, c) {
for (int i = x; i <= n; x += lowbit(x))
tr[i] += c;
}
// 建树
void build() {
for (int i = 1; i <= n; i++)
add(i, a[i]);
}
对于 O(N) 建树的应用场景并不是很多,因为普通建树的时间复杂度为 NlogN 。这个时间复杂度对于大部分题目都是可以接受的,除非有些题目故意卡常什么的。
方法一#
我们知道对于树状数组 tr[x] ,它所维护的区间范围是 [x−lowbit(x)+1,x],所以 tr[x]=a[x−lowbit(x)+1,x] 。那么我们就先可以求 a[] 的前缀和,然后通过前缀和 O(1) 求出 [x−lowbit(x)+1,x] 的区间和,从而实现 O(N) 建立树状数组。
代码实现
int tr[N]; // 树状数组数据
int a[N]; // 原数组数据
int sum[N]; // sum[] 存储 a[] 的前缀和
int n; // 数列长度
int lowbit(int x) { return x & -x; }
// 建树
void build() {
// 求 a[] 的前缀和 sum[]
for (int i = 1; i <= n; i++)
sum[i] = sum[i - 1] + a[i];
// 利用前缀和求出区间和,O(N)建树
for (int i = 1; i <= n; i++)
tr[i] = sum[i] - sum[i - lowbit(i)];
}
方法二#
观察上图我们发现,对于 O(logN) 建树的情况,当 C[x] 被更新的时候,它们都会再更新它们的父节点。那么这样就会导致 C[x] 多次更新它的父节点,产生很多重复的计算。
我们还知道,对于 C[x] 的父节点是 C[x+lowbit(x)] 。那么我们就可以从 1 到 n ,让每个 C[i] 节点只更新一次自己的父节点就行了。
用这种方式,同样也可以实现 O(N) 建立树状数组。而且这种方式相对于方法一,会更省事点,也不用提前预处理出来前缀和。
代码实现
int tr[N]; // 树状数组数据
int a[N]; // 原数组数据
int n; // 数列长度
int lowbit(int x) { return x & -x; }
// 建树
void build() {
for (int i = 1; i <= n; i++) {
tr[i] += a[i];
int fa = i + lowbit(i); // 获得父节点下标
if (fa <= n) // 判断父节点是否超出数列范围
tr[fa] += tr[i];
}
}
维护区间和#
单点修改,区间查询#
给定一个长度为 n 的数列,要对数列进行 Q 次以下两种操作:
1 x y
:将 x 位置的数加上 y (或者减去 y 、变成 y、乘以 y )。2 x y
:查询区间 [x,y] 的和。
这是树状数组最基本的用法。
时间复杂度
- 单点修改 O(logN)
- 区间查询 O(logN)
代码实现
int tr[N];
int a[N];
int n;
int lowbit(int x) { return x & -x; }
// 给 x 位置的数加上 c
void add(int x, int c) {
for (int i = x; i <= n; i += lowbit(i))
tr[i] += c;
}
// 查询 1 ~ x 的区间和
void query(int x) {
int res = 0;
for (int i = x; i; i -= lowbit(i))
res += tr[i];
return res;
}
// 使用
add(x, c); // 给 x 位置的数加上 c
add(x, y - (query(x) - query(x - 1))); // 讲 x 位置的数改为 y
int val1 = query(x); // 查询 [1, x] 的区间和
int val2 = query(r) - query(l - 1); // 查询 [l, r] 的区间和
int val3 = query(x) - query(x - 1); // 查询 x 位置的值
区间修改,单点查询#
给定一个长度为 n 的数列,要对数列进行 Q 次以下两种操作:
1 x y k
:将区间 [x,y] 里的数都加上 k (或者都减去 k)。2 x
:查询 x 位置的值
这里我们需要用到差分,从而利用树状数组来维护差分数组。
- 区间修改:
add(l, k), add(r + 1, -k);
- 单点查询:
query(y) - query(x - 1);
时间复杂度
- 区间修改:O(logN)
- 单点查询:O(logN)
代码实现
int tr[N];
int a[N];
int n;
int lowbit(int x) { return x & -x; }
// 给 x 位置的数加上 c
void add(int x, int c) {
for (int i = x; i <= n; i += lowbit(i)) tr[i] += c;
}
// 查询 1 ~ x 的区间和
void query(int x) {
int res = 0;
for (int i = x; i; i -= lowbit(i)) res += tr[i];
return res;
}
// 使用
add(r, c), add(l - 1, c); // 讲区间 [l, r] 都加上 c
int val = query(x) + a[x]; // 查询 x 位置的值
区间修改,区间查询#
给定一个长度为 n 的数列,要对数列进行 Q 次以下两种操作:
1 x y k
:将区间 [x,y] 里的数都加上 k (或者都减去 k)。2 x y
:查询 [x,y] 的区间和。
平时遇到这种问题,我们一般都会选择用线段树来解决,但是树状数组也能实现。
这里我们首先想到要用差分数组来实现,但是怎么才能查询区间和呢?
对于数列 a[i] ,它的差分数组为 b[i]=a[i]−a[i−1] ,a[i] 的值就是 b[i] 的前缀和。那么对于 a[i] 的前缀和就有,
那么就有,那么就有,(1)∑i=1xai=a1+a2+a3+...+ax(2)=b1(3)+b1+b2(4)+b1+b2+b3(5)+b1+b2+b3+b4(6)⋮(7)+b1+b2+b3+b4+⋯+bx(8)那么就有,∑i=1xai=∑i=1x∑j=1ibj
如果我们对所列出的式子进行补充,变成一个矩阵,如下图所示。
如果我们根据列进行求和,那么前缀和的表示公式就能变形为,
(9)∑i=1xai=(b1+b2+b3+...+bx)×(x+1)−(b1+2b2+3b3+...+xbx)(10)=∑i=1xbi−∑i=1xi×bi
这样我们就能把问题转化成维护 bi 和 i×bi 的前缀和数组,从而用两个树状数组来 tr1 和 tr2 来分别维护 bi 和 i×bi 的前缀和。
- 区间查询:获取前缀和,直接根据公式计算。
- 时间复杂度:O(logN)
- 区间修改:分别对 tr1 和 tr2 所维护的前缀和做出相应的修改。
- 时间复杂度:O(logN)
- 对于 tr1 ,执行
add(x, k), add(y + 1, -k);
- 对于 tr2 ,执行
add(x, x * k), add(y + 1, (y + 1) * k);
代码实现
#define int long long
int tr1[N]; // 维护 b[i] 的前缀和
int tr2[N]; // 维护 i * b[i] 的前缀和
int a[N]; // 原数组
int n;
int lowbit(int x) { return x & -x; }
// 对树状数组 tr[] 执行加和操作
void add(int tr[], int x, int c) {
for (int i = x; i <= n; i += lowbit(i)) tr[i] += c;
}
// 对树状数组 tr[] 执行查询前缀和的操作
int query(int tr[], int x) {
int res = 0;
for (int i = x; i; i -= lowbit(i)) res += tr[i];
return res;
}
// 建树
void build() {
for (int i = 1; i <= n; i++) {
int b = a[i] - a[i - 1]; // 差分 b[i]
add(tr1, i, b);
add(tr2, i, i * b);
}
}
// 查询数列的前缀和
int pre_sum(int x) {
return query(tr1, x) * (x + 1) - query(tr2, x);
}
// 执行操作
// 建树(初始化)
build();
// 区间查询
int val = pre_sum(y) - pre_sum(x - 1); // [x, y] 的区间和
// 区间修改
add(tr1, x, k), add(tr1, y + 1, -k); // 修改 tr1[]
add(tr2, x, x * k), add(tr2, y + 1, (y + 1) * -k); // 修改 tr2[]
整合的维护区间和的完成代码,支持区间修改和区间查询(函数封装好)
维护二维子矩阵和(二维树状数组)#
单点修改,子矩阵查询#
给定一个 n×m 的矩阵 A,要对矩阵进行 Q 次以下两种操作:
1 x y k
:将元素 Ax,y 加上 k (或者都减去 k)。2 a b c d
:查询左上角为 (a,b) ,右上角为 (c,d) 的子矩阵内所有数的和。
二维树状数组就是树状数组套树状数组。就是在原先一维树状数组的基础上,用此树状数组的节点再来建立树状数组,从而实现维护矩阵和的功能。
我们思考树状数组的修改逻辑,就是当某一个节点被修改时,有多少的节点会被影响到,然后再修改这些被影响的节点。所以对于矩阵 A 中节点的改变,就会影响到一维树状数组的节点值,然后做出相对应的修改。同样的,一维树状数组的改变,也会影响到第二维树状数组的节点值,也要做出相对应的修改。
一维树状数组的修改是 O(logN) ,所以会影响到 logN 个节点。对于一维树状数组每个被修改的节点,都需要再 O(logN) 更新二维树状数组的节点值。
所以修改操作的时间复杂度为 O(log2N) 。
而对于二维前缀和的初始化,有 sum[i][j] = sum[i - 1][j] + sum[i][j - 1] - sum[i - 1][j - 1] + a[i][j];
(不做具体解释,不会的可以先学一学,下面的也一样)。
同理,对于查询操作,我们知道通过二维前缀和来求子矩阵的式子为,Sum = sum[x2][y2] - sum[x1 - 1][y2] - sum[x2][y1 - 1] + sum[x1 - 1][y1 - 1];
。
那么只需要获取它们维护的前缀和,然后根据公式计算出结果,时间复杂度也为 O(log2N) 。
那么这就是二维树状数组的基本逻辑,从而实现维护矩阵和的功能。
时间复杂度
-
初始化:N2log2N
-
单点修改:O(log2N)
-
子矩阵查询:O(log2N)
代码实现
#define int long long
int tr[N][N]; // 二维树状数组
int a[N][N]; // 原数组
int n, m; // 行高和列宽
int lowbit(int x) { return x & -x; }
// 给 (x, y) 位置的数加上 c
void add(int x, int y, int c) {
for (int i = x; i <= n; i += lowbit(i))
for (int j = y; j <= m; j += lowbit(j))
tr[i][j] += c;
}
// 查询 (x, y) 位置的二维前缀和
int query(int x, int y) {
int res = 0;
for (int i = x; i; i -= lowbit(i))
for (int j = y; j; j -= lowbit(j))
res += tr[i][j];
return res;
}
// 建立二维树状数组(初始化)
void build() {
for (int i = 1; i <= n; i++) {
for (int j = 1; j <= m; j++) {
int val = query(i - 1, j)
+ query(i, j - 1)
- query(i - 1, j - 1)
+ a[i][j];
add(i, j, val);
}
}
}
// // 查询左上角为(x1, y1), 右下角为(x2, y2) 的子矩阵的和
int query(int x1, int y1, int x2, int y2) {
return query(x2, y2)
- query(x1 - 1, y2)
- query(x2, y1 - 1)
+ query(x1 - 1, y1 - 1);
}
// 使用
build(); // 初始化
add(x, y, c); // 给 (x, y) 位置的数加上 c
add(x, y, -c); // 给 (x, y) 位置的数减去 c
int sum1 = query(x, y); // 查询左上角为(1, 1), 右下角为(x, y) 的子矩阵的和
int sum2 = query(a, b, c, d); // 查询左上角为(a, b), 右下角为(c, d) 的子矩阵的和
子矩阵修改,单点查询#
给定一个 n×m 的矩阵 A,要对矩阵进行 Q 次以下两种操作:
1 a b c d k
:将左上角为 (a,b) ,右上角为 (c,d) 的子矩阵里的每个元素都加上 k (或者都减去 k)。2 x y
:询问元素 Ax,y 的值。
和上面进行区间修改,单点查询的相同,这个是用一维树状数组来维护一维差分数组。那么同理,我们也可以用二维树状数组来维护二维差分数组。
对于二维差分数组,我们每次的矩阵修改操作为,b[x1][y1] += c, b[x2 + 1, y1] -= c, b[x1, y2 + 1] -= c, b[x2 + 1][y2 + 1] += c;
,每次的单点查询操作就是求一次二维前缀和。
时间复杂度
- 子矩阵修改:O(log2N)
- 单点查询:O(log2N)
代码实现
#define int long long
int tr[N][N]; // 二维树状数组
int a[N][N]; // 原数组
int n, m; // 行高和列宽
int lowbit(int x) { return x & -x; }
void add(int x, int y, int c) {
for (int i = x; i <= n; i += lowbit(i))
for (int j = y; j <= m; j += lowbit(j))
tr[i][j] += c;
}
void query(int x, int y) {
int res = 0;
for (int i = x; i; i -= lowbit(i))
for (int j = y; j; j -= lowbit(j))
res += tr[i][j];
return res;
}
// 将左上角为 (x1, y1), 右下角为 (x2, y2) 的子矩阵的每个元素都加上 c
void add(int x1, int y1, int x2, int y2, int c) {
add(x1, y1, c);
add(x2 + 1, y1, -c);
add(x1, y2 + 1, -c);
add(x2 + 1, y2 + 1, c);
}
// 使用
add(x1, y1, x2, y2, c); // 将左上角为 (x1, y1), 右下角为 (x2, y2) 的子矩阵的每个元素都加上 c
int val = query(x, y) + a[x][y]; // 查询 (x, y) 位置的元素值
子矩阵修改,子矩阵查询#
给定一个 n×m 的矩阵 A,要对矩阵进行 Q 次以下两种操作:
1 a b c d k
:将左上角为 (a,b) ,右上角为 (c,d) 的子矩阵里的每个元素都加上 k (或者都减去 k)。2 a b c d
:查询左上角为 (a,b) ,右上角为 (c,d) 的子矩阵内所有数的和。
我们可以像上面处理一维区间和那样思考,通过维护二维前缀和数组来解决问题。
具体思路和推导过程就不赘述了,要想了解的可以看这篇博客:数据结构学习笔记-二维树状数组 - 知乎
具体想法是用四个二维树状数组来分别维护 di,j,(i−1)di,j,(j−1)di,j,(i−1)(j−1)di,j 的二维前缀和数组。
然后通过推导出来的公式来计算前缀和,
sn,m=nm∑i=1n∑j=1mdi,j−m∑i=1n∑j=1m(i−1)di,j−n∑i=1n∑j=1m(j−1)di,j+∑i=1n∑j=1m(i−1)(j−1)di,j
代码实现
#define int long long
int a[N][N], b[N][N], c[N][N], d[N][N]; // 二维树状数组
int n, m;
int lowbit(int x) { return x & -x; }
void add(int x, int y, int v) {
for (int i = x; i <= n; i += lowbit(i)) {
for (int j = y; j <= m; j += lowbit(j)) {
a[i][j] += v;
b[i][j] += (x - 1) * v;
c[i][j] += (y - 1) * v;
d[i][j] += (x - 1) * (y - 1) * v;
}
}
}
int query(int x, int y) {
int res = 0;
for (int i = x; i; i -= lowbit(i)) {
for (int j = y; j; j -= lowbit(j)) {
res += x * y * a[i][j]
- y * b[i][j]
- x * c[i][j]
+ d[i][j];
}
}
return res;
}
// 将左上角为 (x1, y1), 右上角 (x2, y2) 的子矩阵的所有元素加上 c
void add(int x1, int y1, int x2, int y2, int c) {
add(x1, y1, v);
add(x1, y2 + 1, -v);
add(x2 + 1, y1, -v);
add(x2 + 1, y2 + 1, v);
}
// 查询左上角为 (x1, y1), 右上角 (x2, y2) 的子矩阵的元素和
int query(int x1, int y1, int x2, int y) {
return query(x2, y2)
- query(x1 - 1, y2)
- query(x2, y1 - 1)
- query(x1 - 1, y1 - 1);
}
// 使用
add(x1, y1, x2, y2, c); // 将左上角为 (x1, y1), 右上角 (x2, y2) 的子矩阵的所有元素加上 c
int sum = query(x1, y1, x2, y2);// 查询左上角为 (x1, y1), 右上角 (x2, y2) 的子矩阵的元素和
求逆序对个数#
给定一个长度为 n 的数列,求其中逆序对的个数。
逆序对:对于 1≤i<j≤n,有 ai>aj 。
归并排序是可以求一个数列中逆序对的个数的,时间复杂度为 O(logN) 。而树状数组也可以求解此类问题,时间复杂度同样为 O(logN) ,而且空间复杂度相对于归并排序会更低。
对于逆序对个数的求解,树状数组是通过求每个 ai 左边比它大的数的个数,然后全部加和得来的。如果每次遍历查肯定不行,那是怎么求出每个 ai 左边比它大的数的个数的呢?
从 1 到 n ,把 ai 作为下标元素,把 ai 位置的数 +1 。然后我们每次查询 1∼ai 的区间和,所得到的值就是 1∼i 中比 ai 小或相等的元素个数(包括 ai 自己)。那么 1∼i 中比 ai 大的元素个数就是 i−sum[1,ai] 。
这样我们遍历 1∼n ,每次 O(logN) 进行前缀和查询和单点修改,那么总的时间复杂度就是 O(NlogN) 。
还有,这样的做法是把 ai 作为下标进行计算。而对于 ai 是负数或者数很大的情况,就需要加上离散化的操作。
如果这样的话,树状数组的时间和空间消耗相对于归并排序都会更多点(虽然总的时空复杂度是相同的)。其实这样就体现出了归并排序求逆序对的好处,它并不用考虑 ai 的取值范围,只能说各有优缺吧。
代码实现
#include <bits/stdc++.h>
using namespace std;
typedef long long LL;
const int N = 1e5 + 10;
int tr[N];
int a[N];
int n;
int lowbit(int x) { return x & -x; }
void add(int x, int c) {
for (int i = x; i <= n; i += lowbit(i)) tr[i] += c;
}
int query(int x) {
int res = 0;
for (int i = x; i; i -= lowbit(i)) res += tr[i];
return res;
}
int main() {
cin >> n;
for (int i = 1; i <= n; i++) scanf("%d", &a[i]);
LL res = 0;
for (int i = 1; i <= n; i++) {
add(a[i], 1);
// 求逆序对的个数
res += i - query(a[i]);
}
cout << res << "\n";
return 0;
}
需要离散化操作的代码
求数列中小于 x 的元素个数#
根据上面求逆序对的思路,我们可以求出数列中小于(大于、小于或等于、大于或等于) x 的元素个数。
同样的,如果数列中有负数或者数很大,就还得需要 O(NlogN) 来进行离散化处理。
这里注意,这种方法只支持离线查询,预处理的时间复杂度为 O(NlogN),对于每次查询的时间复杂度为 O(logN) 。
代码实现
#include <bits/stdc++.h>
using namespace std;
const int N = 1e5 + 10;
int tr[N];
int a[N];
int n;
int lowbit(int x) { return x & -x; }
void add(int x, int c) {
for (int i = x; i <= n; i += lowbit(i)) tr[i] += c;
}
int query(int x) {
int res = 0;
for (int i = x; i; i -= lowbit(i)) res += tr[i];
return res;
}
int main() {
cin >> n;
for (int i = 1; i <= n; i++) scanf("%d", &a[i]);
// 预处理
for (int i = 1; i <= n; i++)
add(a[i], 1);
// 查询
int x;
cin >> x;
int num1 = query(x - 1); // 查询小于 x 的元素个数
int num2 = query(x); // 查询小于等于 x 的元素个数
int num3 = n - query(x); // 查询大于 x 的元素个数
int num4 = n - query(x - 1);// 查询大于等于 x 的元素个数
return 0;
}