树状数组学习笔记

摘自 OI-Wiki

引入

树状数组是一种支持 单点修改 和 区间查询 的，代码量小的数据结构。

什么是「单点修改」和「区间查询」？

假设有这样一道题：

已知一个数列 $a$ ，你需要进行下面两种操作：

给定 $x, y$ ，将 $a [x]$ 自增 $y$ 。
给定 $l, r$ ，求解 $a [l \dots r]$ 的和。

其中第一种操作就是「单点修改」，第二种操作就是「区间查询」。

类似地，还有：「区间修改」、「单点查询」。它们分别的一个例子如下：

区间修改：给定 $l, r, x$ ，将 $a [l \dots r]$ 中的每个数都分别自增 $x$ ；
单点查询：给定 $x$ ，求解 $a [x]$ 的值。

注意到，区间问题一般严格强于单点问题，因为对单点的操作相当于对一个长度为 $1$ 的区间操作。

普通树状数组维护的信息及运算要满足 结合律 且 可差分，如加法（和）、乘法（积）、异或等。

结合律： $(x \circ y) \circ z = x \circ (y \circ z)$ ，其中 $\circ$ 是一个二元运算符。
可差分：具有逆运算的运算，即已知 $x \circ y$ 和 $x$ 可以求出 $y$ 。

需要注意的是：

模意义下的乘法若要可差分，需保证每个数都存在逆元（模数为质数时一定存在）；
例如 $gcd$ ， $max$ 这些信息不可差分，所以不能用普通树状数组处理，但是：
- 使用两个树状数组可以用于处理区间最值，见 Efficient Range Minimum Queries using Binary Indexed Trees。
- 本页面也会介绍一种支持不可差分信息查询的， $Θ (\log^{2} n)$ 时间复杂度的拓展树状数组。

事实上，树状数组能解决的问题是线段树能解决的问题的子集：树状数组能做的，线段树一定能做；线段树能做的，树状数组不一定可以。然而，树状数组的代码要远比线段树短，时间效率常数也更小，因此仍有学习价值。

有时，在差分数组和辅助数组的帮助下，树状数组还可解决更强的 区间加单点值 和 区间加区间和 问题。

树状数组

初步感受

先来举个例子：我们想知道 $a [1 \dots 7]$ 的前缀和，怎么做？

一种做法是： $a_{1} + a_{2} + a_{3} + a_{4} + a_{5} + a_{6} + a_{7}$ ，需要求 $7$ 个数的和。

但是如果已知三个数 $A$ ， $B$ ， $C$ ， $A = a [1 \dots 4]$ 的和， $B = a [5 \dots 6]$ 的总和， $C = a [7 \dots 7]$ 的总和（其实就是 $a [7]$ 自己）。你会怎么算？你一定会回答： $A + B + C$ ，只需要求 $3$ 个数的和。

这就是树状数组能快速求解信息的原因：我们总能将一段前缀 $[1, n]$ 拆成 不多于 $\log n$ 段区间，使得这 $\log n$ 段区间的信息是 已知的。

于是，我们只需合并这 $\log n$ 段区间的信息，就可以得到答案。相比于原来直接合并 $n$ 个信息，效率有了很大的提高。

不难发现信息必须满足结合律，否则就不能像上面这样合并了。

下面这张图展示了树状数组的工作原理：

最下面的八个方块代表原始数据数组 $a$ 。上面参差不齐的方块（与最上面的八个方块是同一个数组）代表数组 $a$ 的上级 —— $c$ 数组。

$c$ 数组就是用来储存原始数组 $a$ 某段区间的和的，也就是说，这些区间的信息是已知的，我们的目标就是把查询前缀拆成这些小区间。

例如，从图中可以看出：

$c_{2}$ 管辖的是 $a [1 \dots 2]$ ；
$c_{4}$ 管辖的是 $a [1 \dots 4]$ ；
$c_{6}$ 管辖的是 $a [5 \dots 6]$ ；
$c_{8}$ 管辖的是 $a [1 \dots 8]$ ；
剩下的 $c [x]$ 管辖的都是 $a [x]$ 自己（可以看做 $a [x \dots x]$ 的长度为 $1$ 的小区间）。

不难发现， $c [x]$ 管辖的一定是一段右边界是 $x$ 的区间总信息。我们先不关心左边界，先来感受一下树状数组是如何查询的。

举例：计算 $a [1 \dots 7]$ 的和。

过程：从 $c_{7}$ 开始往前跳，发现 $c_{7}$ 只管辖 $a_{7}$ 这个元素；然后找 $c_{6}$ ，发现 $c_{6}$ 管辖的是 $a [5 \dots 6]$ ，然后跳到 $c_{4}$ ，发现 $c_{4}$ 管辖的是 $a [1 \dots 4]$ 这些元素，然后再试图跳到 $c_{0}$ ，但事实上 $c_{0}$ 不存在，不跳了。

我们刚刚找到的 $c$ 是 $c_{7}, c_{6}, c_{4}$ ，事实上这就是 $a [1 \dots 7]$ 拆分出的三个小区间，合并得到答案是 $c_{7} + c_{6} + c_{4}$ 。

举例：计算 $a [4 \dots 7]$ 的和。

我们还是从 $c_{7}$ 开始跳，跳到 $c_{6}$ 再跳到 $c_{4}$ 。此时我们发现它管理了 $a [1 \dots 4]$ 的和，但是我们不想要 $a [1 \dots 3]$ 这一部分，怎么办呢？很简单，减去 $a [1 \dots 3]$ 的和就行了。

那不妨考虑最开始，就将查询 $a [4 \dots 7]$ 的和转化为查询 $a [1 \dots 7]$ 的和，以及查询 $a [1 \dots 3]$ 的和，最终将两个结果作差。

管辖区间

那么问题来了， $c [x] (x \geq 1)$ 管辖的区间到底往左延伸多少？也就是说，区间长度是多少？

树状数组中，规定 $c [x]$ 管辖的区间长度为 $2^{k}$ ，其中：

设二进制最低位为第 $0$ 位，则 $k$ 恰好为 $x$ 二进制表示中，最低位的 1 所在的二进制位数；
$2^{k}$ （ $c [x]$ 的管辖区间长度）恰好为 $x$ 二进制表示中，最低位的 1 以及后面所有 0 组成的数。

举个例子， $c_{88}$ 管辖的是哪个区间？

因为 $88_{(10)} = 01011000_{(2)}$ ，其二进制最低位的 1 以及后面的 0 组成的二进制是 1000，即 $8$ ，所以 $c_{88}$ 管辖 $8$ 个 $a$ 数组中的元素。

因此， $c_{88}$ 代表 $a [81 \dots 88]$ 的区间信息。

我们记 $x$ 二进制最低位 1 以及后面的 0 组成的数为 $lowbit (x)$ ，那么 $c [x]$ 管辖的区间就是 $[x - lowbit (x) + 1, x]$ 。

这里注意： $lowbit$ 指的不是最低位 1 所在的位数 $k$ ，而是这个 1 和后面所有 0 组成的 $2^{k}$ 。

怎么计算 lowbit？根据位运算知识，可以得到 lowbit(x) = x & -x。

lowbit 的原理

将 x 的二进制所有位全部取反，再加 1，就可以得到 -x 的二进制编码。例如， $6$ 的二进制编码是 110，全部取反后得到 001，加 1 得到 010。

设原先 x 的二进制编码是 (...)10...00，全部取反后得到 [...]01...11，加 1 后得到 [...]10...00，也就是 -x 的二进制编码了。这里 x 二进制表示中第一个 1 是 x 最低位的 1。

(...) 和 [...] 中省略号的每一位分别相反，所以 x & -x = (...)10...00 & [...]10...00 = 10...00，得到的结果就是 lowbit。

实现

c++

int lowbit(int x) {
    // x 的二进制中，最低位的 1 以及后面所有 0 组成的数。
    // lowbit(0b01011000) == 0b00001000
    //          ~~~~^~~~
    // lowbit(0b01110010) == 0b00000010
    //          ~~~~~~^~
    return x & -x;
}

区间查询

接下来我们来看树状数组具体的操作实现，先来看区间查询。

回顾查询 $a [4 \dots 7]$ 的过程，我们是将它转化为两个子过程：查询 $a [1 \dots 7]$ 和查询 $a [1 \dots 3]$ 的和，最终作差。

其实任何一个区间查询都可以这么做：查询 $a [l \dots r]$ 的和，就是 $a [1 \dots r]$ 的和减去 $a [1 \dots l - 1]$ 的和，从而把区间问题转化为前缀问题，更方便处理。

事实上，将有关 $l \dots r$ 的区间询问转化为 $1 \dots r$ 和 $1 \dots l - 1$ 的前缀询问再差分，在竞赛中是一个非常常用的技巧。

那前缀查询怎么做呢？回顾下查询 $a [1 \dots 7]$ 的过程：

从 $c_{7}$ 往前跳，发现 $c_{7}$ 只管辖 $a_{7}$ 这个元素；然后找 $c_{6}$ ，发现 $c_{6}$ 管辖的是 $a [5 \dots 6]$ ，然后跳到 $c_{4}$ ，发现 $c_{4}$ 管辖的是 $a [1 \dots 4]$ 这些元素，然后再试图跳到 $c_{0}$ ，但事实上 $c_{0}$ 不存在，不跳了。
我们刚刚找到的 $c$ 是 $c_{7}, c_{6}, c_{4}$ ，事实上这就是 $a [1 \dots 7]$ 拆分出的三个小区间，合并一下，答案是 $c_{7} + c_{6} + c_{4}$ 。

观察上面的过程，每次往前跳，一定是跳到现区间的左端点的左一位，作为新区间的右端点，这样才能将前缀不重不漏地拆分。比如现在 $c_{6}$ 管的是 $a [5 \dots 6]$ ，下一次就跳到 $5 - 1 = 4$ ，即访问 $c_{4}$ 。

我们可以写出查询 $a [1 \dots x]$ 的过程：

从 $c [x]$ 开始往前跳，有 $c [x]$ 管辖 $a [x - lowbit (x) + 1 \dots x]$ ；
令 $x \leftarrow x - lowbit (x)$ ，如果 $x = 0$ 说明已经跳到尽头了，终止循环；否则回到第一步。
将跳到的 $c$ 合并。

实现时，我们不一定要先把 $c$ 都跳出来然后一起合并，可以边跳边合并。

比如我们要维护的信息是和，直接令初始 $ans = 0$ ，然后每跳到一个 $c [x]$ 就 $ans \leftarrow ans + c [x]$ ，最终 $ans$ 就是所有合并的结果。

实现

c++

int getsum(int x) { // a[1]..a[x]的和
    int ans = 0;
    while (x > 0) {
        ans = ans + c[x];
        x = x - lowbit(x);
    }
    return ans;
}

树状数组与其树形态的性质

在讲解单点修改之前，先讲解树状数组的一些基本性质，以及其树形态来源，这有助于更好理解树状数组的单点修改。

我们约定：

$l (x) = x - lowbit (x) + 1$ 。即， $l (x)$ 是 $c [x]$ 管辖范围的左端点。
对于任意正整数 $x$ ，总能将 $x$ 表示成 $s \times 2^{k + 1} + 2^{k}$ 的形式，其中 $lowbit (x) = 2^{k}$ 。
下面「 $c [x]$ 和 $c [y]$ 不交」指 $c [x]$ 的管辖范围和 $c [y]$ 的管辖范围不相交，即 $[l (x), x]$ 和 $[l (y), y]$ 不相交。「 $c [x]$ 包含于 $c [y]$ 」等表述同理。

性质 $1$ ：对于 $x \leq y$ ，要么有 $c [x]$ 和 $c [y]$ 不交，要么有 $c [x]$ 包含于 $c [y]$ 。

性质 $2$ ： $c [x]$ 真包含于 $c [x + lowbit (x)]$ 。

性质 $3$ ：对于任意 $x < y < x + lowbit (x)$ ，有 $c [x]$ 和 $c [y]$ 不交。

有了这三条性质的铺垫，我们接下来再来看树状数组的树形态（请忽略 $a$ 向 $c$ 的连边）。

事实上，树状数组的树形态是 $x$ 向 $x + lowbit (x)$ 连边得到的图，其中 $x + lowbit (x)$ 是 $x$ 的父亲。

注意，在考虑树状数组的树形态时，我们不考虑树状数组大小的影响，即我们认为这是一棵无限大的树，方便分析。实际实现时，我们只需用到 $x \leq n$ 的 $c [x]$ ，其中 $n$ 是原数组长度。

这棵树天然满足了很多美好性质，下面列举若干（设 $f a [u]$ 表示 $u$ 的直系父亲）：

$u < f a [u]$ 。
$u$ 大于任何一个 $u$ 的后代，小于任何一个 $u$ 的祖先。
点 $u$ 的 $lowbit$ 严格小于 $f a [u]$ 的 $lowbit$ 。
点 $x$ 的高度是 $\log_{2} lowbit (x)$ ，即 $x$ 二进制最低位 1 的位数。
$c [u]$ 真包含于 $c [f a [u]]$ （性质 $2$ ）。
$c [u]$ 真包含于 $c [v]$ ，其中 $v$ 是 $u$ 的任一祖先（在上一条性质上归纳）。
$c [u]$ 真包含 $c [v]$ ，其中 $v$ 是 $u$ 的任一后代（上面那条性质 $u$ ， $v$ 颠倒）。
对于任意 $v^{'} > u$ ，若 $v^{'}$ 不是 $u$ 的祖先，则 $c [u]$ 和 $c [v^{'}]$ 不交。
对于任意 $v < u$ ，如果 $v$ 不在 $u$ 的子树上，则 $c [u]$ 和 $c [v]$ 不交（上面那条性质 $u$ ， $v^{'}$ 颠倒）。
对于任意 $v > u$ ，当且仅当 $v$ 是 $u$ 的祖先， $c [u]$ 真包含于 $c [v]$ （上面几条性质的总结）。这就是树状数组单点修改的核心原理。
设 $u = s \times 2^{k + 1} + 2^{k}$ ，则其儿子数量为 $k = \log_{2} lowbit (u)$ ，编号分别为 $u - 2^{t} (0 \leq t < k)$ 。
- 举例：假设 $k = 3$ ， $u$ 的二进制编号为 ...1000，则 $u$ 有三个儿子，二进制编号分别为 ...0111、...0110、...0100
$u$ 的所有儿子对应 $c$ 的管辖区间恰好拼接成 $[l (u), u - 1]$ 。
- 举例：假设 $k = 3$ ， $u$ 的二进制编号为 ...1000，则 $u$ 有三个儿子，二进制编号分别为 ...0111、...0110、...0100。
- c[...0100] 表示 a[...0001 ~ ...0100]。
- c[...0110] 表示 a[...0101 ~ ...0110]。
- c[...0111] 表示 a[...0111 ~ ...0111]。
- 不难发现上面是三个管辖区间的并集恰好是 a[...0001 ~ ...0111]，即 $[l (u), u - 1]$ 。

单点修改

现在来考虑如何单点修改 $a [x]$ 。

我们的目标是快速正确地维护 $c$ 数组。为保证效率，我们只需遍历并修改管辖了 $a [x]$ 的所有 $c [y]$ ，因为其他的 $c$ 显然没有发生变化。

管辖 $a [x]$ 的 $c [y]$ 一定包含 $c [x]$ （根据性质 $1$ ），所以 $y$ 在树状数组树形态上是 $x$ 的祖先。因此我们从 $x$ 开始不断跳父亲，直到跳得超过了原数组长度为止。

设 $n$ 表示 $a$ 的大小，不难写出单点修改 $a [x]$ 的过程：

初始令 $x^{'} = x$ 。
修改 $c [x^{'}]$ 。
令 $x^{'} \leftarrow x^{'} + lowbit (x^{'})$ ，如果 $x^{'} > n$ 说明已经跳到尽头了，终止循环；否则回到第二步。

区间信息和单点修改的种类，共同决定 $c [x^{'}]$ 的修改方式。下面给几个例子：

若 $c [x^{'}]$ 维护区间和，修改种类是将 $a [x]$ 加上 $p$ ，则修改方式则是将所有 $c [x^{'}]$ 也加上 $p$ 。
若 $c [x^{'}]$ 维护区间积，修改种类是将 $a [x]$ 乘上 $p$ ，则修改方式则是将所有 $c [x^{'}]$ 也乘上 $p$ 。

然而，单点修改的自由性使得修改的种类和维护的信息不一定是同种运算，比如，若 $c [x^{'}]$ 维护区间和，修改种类是将 $a [x]$ 赋值为 $p$ ，可以考虑转化为将 $a [x]$ 加上 $p - a [x]$ 。如果是将 $a [x]$ 乘上 $p$ ，就考虑转化为 $a [x]$ 加上 $a [x] \times p - a [x]$ 。

下面以维护区间和，单点加为例给出实现。

实现

c++

void add(int x, int k) {
    while (x <= n) { // 不能越界
        c[x] = c[x] + k;
        x = x + lowbit(x);
    }
}

建树

也就是根据最开始给出的序列，将树状数组建出来（ $c$ 全部预处理好）。

一般可以直接转化为 $n$ 次单点修改，时间复杂度 $Θ (n \log n)$ （复杂度分析在后面）。

比如给定序列 $a = (5, 1, 4)$ 要求建树，直接看作对 $a [1]$ 单点加 $5$ ，对 $a [2]$ 单点加 $1$ ，对 $a [3]$ 单点加 $4$ 即可。

复杂度分析

空间复杂度显然 $Θ (n)$ 。

时间复杂度：

对于区间查询操作：整个 $x \leftarrow x - lowbit (x)$ 的迭代过程，可看做将 $x$ 二进制中的所有 $1$ ，从低位到高位逐渐改成 $0$ 的过程，拆分出的区间数等于 $x$ 二进制中 $1$ 的数量（即 $popcount (x)$ ）。因此，单次查询时间复杂度是 $Θ (\log n)$ ；
对于单点修改操作：跳父亲时，访问到的高度一直严格增加，且始终有 $x \leq n$ 。由于点 $x$ 的高度是 $\log_{2} lowbit (x)$ ，所以跳到的高度不会超过 $\log_{2} n$ ，所以访问到的 $c$ 的数量是 $\log n$ 级别。因此，单次单点修改复杂度是 $Θ (\log n)$ 。

区间加区间和

前置知识：前缀和 & 差分。

该问题可以使用两个树状数组维护差分数组解决。

考虑序列 $a$ 的差分数组 $d$ ，其中 $d [i] = a [i] - a [i - 1]$ 。由于差分数组的前缀和就是原数组，所以 $a_{i} = \sum_{j = 1}^{i} d_{j}$ 。

一样地，我们考虑将查询区间和通过差分转化为查询前缀和。那么考虑查询 $a [1 \dots r]$ 的和，即 $\sum_{i = 1}^{r} a_{i}$ ，进行推导：

\begin{aligned} \sum_{i = 1}^{r} a_{i} \\ = & \sum_{i = 1}^{r} \sum_{j = 1}^{i} d_{j} \end{aligned}

观察这个式子，不难发现每个 $d_{j}$ 总共被加了 $r - j + 1$ 次。接着推导：

\begin{aligned} \sum_{i = 1}^{r} \sum_{j = 1}^{i} d_{j} \\ = & \sum_{i = 1}^{r} d_{i} \times (r - i + 1) \\ = & \sum_{i = 1}^{r} d_{i} \times (r + 1) - \sum_{i = 1}^{r} d_{i} \times i \end{aligned}

$\sum_{i = 1}^{r} d_{i}$ 并不能推出 $\sum_{i = 1}^{r} d_{i} \times i$ 的值，所以要用两个树状数组分别维护 $d_{i}$ 和 $d_{i} \times i$ 的和信息。

那么怎么做区间加呢？考虑给原数组 $a [l \dots r]$ 区间加 $x$ 给 $d$ 带来的影响。

因为差分是 $d [i] = a [i] - a [i - 1]$ ，

$a [l]$ 多了 $v$ 而 $a [l - 1]$ 不变，所以 $d [l]$ 的值多了 $v$ 。
$a [r + 1]$ 不变而 $a [r]$ 多了 $v$ ，所以 $d [r + 1]$ 的值少了 $v$ 。
对于不等于 $l$ 且不等于 $r + 1$ 的任意 $i$ ， $a [i]$ 和 $a [i - 1]$ 要么都没发生变化，要么都加了 $v$ ， $a [i] + v - (a [i - 1] + v)$ 还是 $a [i] - a [i - 1]$ ，所以其它的 $d [i]$ 均不变。

那就不难想到维护方式了：对于维护 $d_{i}$ 的树状数组，对 $l$ 单点加 $v$ ， $r + 1$ 单点加 $- v$ ；对于维护 $d_{i} \times i$ 的树状数组，对 $l$ 单点加 $v \times l$ ， $r + 1$ 单点加 $- v \times (r + 1)$ 。

而更弱的问题，「区间加求单点值」，只需用树状数组维护一个差分数组 $d_{i}$ 。询问 $a [x]$ 的单点值，直接求 $d [1 \dots x]$ 的和即可。

这里直接给出「区间加区间和」的代码：

c++

int t1[MAXN], t2[MAXN], n;

int lowbit(int x) { return x & (-x); }

void add(int k, int v) {
    int v1 = k * v;
    while (k <= n) {
        t1[k] += v, t2[k] += v1;
        // 注意不能写成 t2[k] += k * v，因为 k 的值已经不是原数组的下标了
        k += lowbit(k);
    }
}

int getsum(int *t, int k) {
    int ret = 0;
    while (k) {
        ret += t[k];
        k -= lowbit(k);
    }
    return ret;
}

void add1(int l, int r, int v) {
    add(l, v), add(r + 1, -v); // 将区间加差分为两个前缀加
}

long long getsum1(int l, int r) {
    return (r + 1ll) * getsum(t1, r) - 1ll * l * getsum(t1, l - 1) -
           (getsum(t2, r) - getsum(t2, l - 1));
}

根据这个原理，应该可以实现「区间乘区间积」，「区间异或一个数，求区间异或值」等，只要满足维护的信息和区间操作是同种运算即可，感兴趣的读者可以自己尝试。

二维树状数组

单点修改，子矩阵查询

二维树状数组，也被称作树状数组套树状数组，用来维护二维数组上的单点修改和前缀信息问题。

与一维树状数组类似，我们用 $c (x, y)$ 表示 $a (x - lowbit (x) + 1, y - lowbit (y) + 1) \dots a (x, y)$ 的矩阵总信息，即一个以 $a (x, y)$ 为右下角，高 $lowbit (x)$ ，宽 $lowbit (y)$ 的矩阵的总信息。

对于单点修改，设：

f (x, i) = {\begin{cases} x & i = 0 \\ f (x, i - 1) + lowbit (f (x, i - 1)) & i > 0 \end{cases}

即 $f (x, i)$ 为 $x$ 在树状数组树形态上的第 $i$ 级祖先（第 $0$ 级祖先是自己）。

则只有 $c (f (x, i), f (y, j))$ 中的元素管辖 $a (x, y)$ ，修改 $a (x, y)$ 时只需修改所有 $c (f (x, i), f (y, j))$ ，其中 $f (x, i) \leq n$ ， $f (y, j) \leq m$ 。

对于查询，我们设：

g (x, i) = {\begin{cases} x & i = 0 \\ g (x, i - 1) - lowbit (g (x, i - 1)) & i, g (x, i - 1) > 0 \\ 0 & otherwise. \end{cases}

则合并所有 $c (g (x, i), g (y, j))$ ，其中 $g (x, i), g (y, j) > 0$ 。

下面给出单点加、查询子矩阵和的代码。

c++

void add(int x, int y, int v) {
    for (int i = x; i <= n; i += lowbit(i)) {
        for (int j = y; j <= m; j += lowbit(j)) {
            // 注意这里必须得建循环变量，不能像一维数组一样直接 while (x <=
            // n) 了
            c[i][j] += v;
        }
    }
}

子矩阵加，求子矩阵和

和一维树状数组的「区间加区间和」问题类似，考虑维护差分数组。

二维数组上的差分数组是这样的：

d (i, j) = a (i, j) - a (i - 1, j) - a (i, j - 1) + a (i - 1, j - 1) 。

这样以来，对左上角 $(x_{1}, y_{1})$ ，右下角 $(x_{2}, y_{2})$ 的子矩阵区间加 $v$ ，相当于在差分数组上，对 $d (x_{1}, y_{1})$ 和 $d (x_{2} + 1, y_{2} + 1)$ 分别单点加 $v$ ，对 $d (x_{2} + 1, y_{1})$ 和 $d (x_{1}, y_{2} + 1)$ 分别单点加 $- v$ 。

至于原因，把这四个 $d$ 分别用定义式表示出来，分析一下每项的变化即可。

举个例子吧，初始差分数组为 $0$ ，给 $a (2, 2) \dots a (3, 4)$ 子矩阵加 $v$ 后差分数组会变为：

(\begin{matrix} 0 & 0 & 0 & 0 & 0 \\ 0 & v & 0 & 0 & - v \\ 0 & 0 & 0 & 0 & 0 \\ 0 & - v & 0 & 0 & v \end{matrix})

（其中 $a (2, 2) \dots a (3, 4)$ 这个子矩阵恰好是上面位于中心的 $2 \times 3$ 大小的矩阵。）

因此，子矩阵加的做法是：转化为差分数组上的四个单点加操作。

现在考虑查询子矩阵和：

对于点 $(x, y)$ ，它的二维前缀和可以表示为：

\sum_{i = 1}^{x} \sum_{j = 1}^{y} \sum_{h = 1}^{i} \sum_{k = 1}^{j} d (h, k)

原因就是差分的前缀和的前缀和就是原本的前缀和。

和一维树状数组的「区间加区间和」问题类似，统计 $d (h, k)$ 的出现次数，为 $(x - h + 1) \times (y - k + 1)$ 。

然后接着推导：

\begin{aligned} \sum_{i = 1}^{x} \sum_{j = 1}^{y} \sum_{h = 1}^{i} \sum_{k = 1}^{j} d (h, k) \\ = & \sum_{i = 1}^{x} \sum_{j = 1}^{y} d (i, j) \times (x - i + 1) \times (y - j + 1) \\ = & \sum_{i = 1}^{x} \sum_{j = 1}^{y} d (i, j) \times (x y + x + y + 1) - d (i, j) \times i \times (y + 1) - d (i, j) \times j \times (x + 1) + d (i, j) \times i \times j \end{aligned}

所以我们需维护四个树状数组，分别维护 $d (i, j)$ ， $d (i, j) \times i$ ， $d (i, j) \times j$ ， $d (i, j) \times i \times j$ 的和信息。

当然了，和一维同理，如果只需要子矩阵加求单点值，维护一个差分数组然后询问前缀和就足够了。

下面给出代码：

c++

using ll = long long;
ll t1[N][N], t2[N][N], t3[N][N], t4[N][N];

void add(ll x, ll y, ll z) {
    for (int X = x; X <= n; X += lowbit(X))
        for (int Y = y; Y <= m; Y += lowbit(Y)) {
            t1[X][Y] += z;
            t2[X][Y] += z * x; // 注意是 z * x 而不是 z * X，后面同理
            t3[X][Y] += z * y;
            t4[X][Y] += z * x * y;
        }
}

void range_add(ll xa, ll ya, ll xb, ll yb,
               ll z) { //(xa, ya) 到 (xb, yb) 子矩阵
    add(xa, ya, z);
    add(xa, yb + 1, -z);
    add(xb + 1, ya, -z);
    add(xb + 1, yb + 1, z);
}

ll ask(ll x, ll y) {
    ll res = 0;
    for (int i = x; i; i -= lowbit(i))
        for (int j = y; j; j -= lowbit(j))
            res += (x + 1) * (y + 1) * t1[i][j] - (y + 1) * t2[i][j] -
                   (x + 1) * t3[i][j] + t4[i][j];
    return res;
}

ll range_ask(ll xa, ll ya, ll xb, ll yb) {
    return ask(xb, yb) - ask(xb, ya - 1) - ask(xa - 1, yb) +
           ask(xa - 1, ya - 1);
}

权值树状数组及应用

我们知道，普通树状数组直接在原序列的基础上构建， $c_{6}$ 表示的就是 $a [5 \dots 6]$ 的区间信息。

然而事实上，我们还可以在原序列的权值数组上构建树状数组，这就是权值树状数组。

运用权值树状数组，我们可以解决一些经典问题。

单点修改，查询全局第 $k$ 小

在此处只讨论第 $k$ 小，第 $k$ 大问题可以通过简单计算转化为第 $k$ 小问题。

该问题可离散化，如果原序列 $a$ 值域过大，离散化后再建立权值数组 $b$ 。注意，还要把单点修改中的涉及到的值也一起离散化，不能只离散化原数组 $a$ 中的元素。

对于单点修改，只需将对原数列的单点修改转化为对权值数组的单点修改即可。具体来说，原数组 $a [x]$ 从 $y$ 修改为 $z$ ，转化为对权值数组 $b$ 的单点修改就是 $b [y]$ 单点减 $1$ ， $b [z]$ 单点加 $1$ 。

对于查询第 $k$ 小，考虑二分 $x$ ，查询权值数组中 $[1, x]$ 的前缀和，找到 $x_{0}$ 使得 $[1, x_{0}]$ 的前缀和 $< k$ 而 $[1, x_{0} + 1]$ 的前缀和 $\geq k$ ，则第 $k$ 大的数是 $x_{0} + 1$ （注：这里认为 $[1, 0]$ 的前缀和是 $0$ ）。

这样做时间复杂度是 $Θ (\log^{2} n)$ 的。

考虑用倍增替代二分。

设 $x = 0$ ， $sum = 0$ ，枚举 $i$ 从 $\log_{2} n$ 降为 $0$ ：

查询权值数组中 $[x + 1 \dots x + 2^{i}]$ 的区间和 $t$ 。
如果 $sum + t < k$ ，扩展成功， $x \leftarrow x + 2^{i}$ ， $sum \leftarrow sum + t$ ；否则扩展失败，不操作。

这样得到的 $x$ 是满足 $[1 \dots x]$ 前缀和 $< k$ 的最大值，所以最终 $x + 1$ 就是答案。

看起来这种方法时间效率没有任何改善，但事实上，查询 $[x + 1 \dots x + 2^{i}]$ 的区间和只需访问 $c [x + 2^{i}]$ 的值即可。

原因很简单，考虑 $lowbit (x + 2^{i})$ ，它一定是 $2^{i}$ ，因为 $x$ 之前只累加过 $2^{j}$ 满足 $j > i$ 。因此 $c [x + 2^{i}]$ 表示的区间就是 $[x + 1 \dots x + 2^{i}]$ 。

如此一来，时间复杂度降低为 $Θ (\log n)$ 。

全局逆序对（全局二维偏序）

全局逆序对也可以用权值树状数组巧妙解决。问题是这样的：给定长度为 $n$ 的序列 $a$ ，求 $a$ 中满足 $i < j$ 且 $a [i] > a [j]$ 的数对 $(i, j)$ 的数量。

该问题可离散化，如果原序列 $a$ 值域过大，离散化后再建立权值数组 $b$ 。

我们考虑从 $n$ 到 $1$ 倒序枚举 $i$ ，作为逆序对中第一个元素的索引，然后计算有多少个 $j > i$ 满足 $a [j] < a [i]$ ，最后累计答案即可。

事实上，我们只需要这样做（设当前 $a [i] = x$ ）：

查询 $b [1 \dots x - 1]$ 的前缀和，即为左端点为 $a [i]$ 的逆序对数量。
$b [x]$ 自增 $1$ ；

原因十分自然：出现在 $b [1 \dots x - 1]$ 中的元素一定比当前的 $x = a [i]$ 小，而 $i$ 的倒序枚举，自然使得这些已在权值数组中的元素，在原数组上的索引 $j$ 大于当前遍历到的索引 $i$ 。

用例子说明， $a = (4, 3, 1, 2, 1)$ 。

$i$ 按照 $5 \to 1$ 扫：

$a [5] = 1$ ，查询 $b [1 \dots 0]$ 前缀和，为 $0$ ， $b [1]$ 自增 $1$ ， $b = (1, 0, 0, 0)$ 。
$a [4] = 2$ ，查询 $b [1 \dots 1]$ 前缀和，为 $1$ ， $b [2]$ 自增 $1$ ， $b = (1, 1, 0, 0)$ 。
$a [3] = 1$ ，查询 $b [1 \dots 0]$ 前缀和，为 $0$ ， $b [1]$ 自增 $1$ ， $b = (2, 1, 0, 0)$ 。
$a [2] = 3$ ，查询 $b [1 \dots 2]$ 前缀和，为 $3$ ， $b [3]$ 自增 $1$ ， $b = (2, 1, 1, 0)$ 。
$a [1] = 4$ ，查询 $b [1 \dots 3]$ 前缀和，为 $4$ ， $b [4]$ 自增 $1$ ， $b = (2, 1, 1, 1)$ 。

所以最终答案为 $0 + 1 + 0 + 3 + 4 = 8$ 。

注意到，遍历 $i$ 后的查询 $b [1 \dots x - 1]$ 和自增 $b [x]$ 的两个步骤可以颠倒，变成先自增 $b [x]$ 再查询 $b [1 \dots x - 1]$ ，不影响答案。两个角度来解释：

对 $b [x]$ 的修改不影响对 $b [1 \dots x - 1]$ 的查询。
颠倒后，实质是在查询 $i \leq j$ 且 $a [i] > a [j]$ 的数对数量，而 $i = j$ 时不存在 $a [i] > a [j]$ ，所以 $i \leq j$ 相当于 $i < j$ ，所以这与原来的逆序对问题是等价的。

如果查询非严格逆序对（ $i < j$ 且 $a [i] \geq a [j]$ ）的数量，那就要改为查询 $b [1 \dots x]$ 的和，这时就不能颠倒两步了，还是两个角度来解释：

对 $b [x]$ 的修改影响对 $b [1 \dots x]$ 的查询。
颠倒后，实质是在查询 $i \leq j$ 且 $a [i] \geq a [j]$ 的数对数量，而 $i = j$ 时恒有 $a [i] \geq a [j]$ ，所以 $i \leq j$ 不相当于 $i < j$ ，与原问题 不等价。

如果查询 $i \leq j$ 且 $a [i] \geq a [j]$ 的数对数量，那这两步就需要颠倒了。

另外，对于原逆序对问题，还有一种做法是正着枚举 $j$ ，查询有多少 $i < j$ 满足 $a [i] > a [j]$ 。做法如下（设 $x = a [j]$ ）：

查询 $b [x + 1 \dots V]$ （ $V$ 是 $b$ 的大小，即 $a$ 的值域（或离散化后的值域））的区间和。
将 $b [x]$ 自增 $1$ 。

原因：出现在 $b [x + 1 \dots V]$ 中的元素一定比当前的 $x = a [j]$ 大，而 $j$ 的正序枚举，自然使得这些已在权值数组中的元素，在原数组上的索引 $i$ 小于当前遍历到的索引 $j$ 。

树状数组维护不可差分信息

比如维护区间最值等。

注意，这种方法虽然码量小，但单点修改和区间查询的时间复杂度均为 $Θ (\log^{2} n)$ ，比使用线段树的时间复杂度 $Θ (\log n)$ 劣。

区间查询

我们还是基于之前的思路，从 $r$ 沿着 $lowbit$ 一直向前跳，但是我们不能跳到 $l$ 的左边。

因此，如果我们跳到了 $c [x]$ ，先判断下一次要跳到的 $x - lowbit (x)$ 是否小于 $l$ ：

如果小于 $l$ ，我们直接把 $a [x]$ 单点 合并到总信息里，然后跳到 $c [x - 1]$ 。
如果大于等于 $l$ ，说明没越界，正常合并 $c [x]$ ，然后跳到 $c [x - lowbit (x)]$ 即可。

可以证明，上述算法的时间复杂度是 $Θ (\log^{2} n)$ 。

单点更新

更新 $a [x]$ 后，我们只需要更新满足在树状数组树形态上，满足 $y$ 是 $x$ 的祖先的 $c [y]$ 。

对于最值（以最大值为例），一种常见的错误想法是，如果 $a [x]$ 修改成 $p$ ，则将所有 $c [y]$ 更新为 $max (c [y], p)$ 。下面是一个反例： $(1, 2, 3, 4, 5)$ 中将 $5$ 修改成 $4$ ，最大值是 $4$ ，但按照上面的修改这样会得到 $5$ 。将 $c [y]$ 直接修改为 $p$ 也是错误的，一个反例是，将上面例子中的 $3$ 修改为 $4$ 。

事实上，对于不可差分信息，不存在通过 $p$ 直接修改 $c [y]$ 的方式。这是因为修改本身就相当于是把旧数从原区间「移除」，然后加入一个新数。「移除」时对区间信息的影响，相当于做「逆运算」，而不可差分信息不存在「逆运算」，所以无法直接修改 $c [y]$ 。

换句话说，对每个受影响的 $c [y]$ ，这个区间的信息我们必定要重构了。

考虑 $c [y]$ 的儿子们，它们的信息一定是正确的（因为我们先更新儿子再更新父亲），而这些儿子又恰好组成了 $[l (y), y - 1]$ 这一段管辖区间，那再合并一个单点 $a [y]$ 就可以合并出 $[l (y), y]$ ，也就是 $c [y]$ 了。这样，我们能用至多 $\log n$ 个区间重构合并出每个需要修改的 $c$ 。

容易看出上述算法时间复杂度为 $Θ (\log^{2} n)$ 。

树状数组 学习笔记 ​

引入 ​

树状数组 ​

初步感受 ​

管辖区间 ​

实现 ​

区间查询 ​

实现 ​

树状数组与其树形态的性质 ​

单点修改 ​

实现 ​

建树 ​

复杂度分析 ​

区间加区间和 ​

二维树状数组 ​

单点修改，子矩阵查询 ​

子矩阵加，求子矩阵和 ​

权值树状数组及应用 ​

单点修改，查询全局第 k 小 ​

全局逆序对（全局二维偏序） ​

树状数组维护不可差分信息 ​

区间查询 ​

单点更新 ​

树状数组学习笔记

引入

树状数组

初步感受

管辖区间

实现

区间查询

实现

树状数组与其树形态的性质

单点修改

实现

建树

复杂度分析

区间加区间和

二维树状数组

单点修改，子矩阵查询

子矩阵加，求子矩阵和

权值树状数组及应用

单点修改，查询全局第 $k$ 小

全局逆序对（全局二维偏序）

树状数组维护不可差分信息

区间查询

单点更新