65-Lowest-Common-Ancestor

定义

最近公共祖先简称 LCA（Lowest Common Ancestor）。两个节点的最近公共祖先，就是这两个点的公共祖先里面，离根最远的那个。为了方便，我们记某点集 $S = {v_{1}, v_{2}, \dots, v_{n}}$ 的最近公共祖先为 $LCA (v_{1}, v_{2}, \dots, v_{n})$ 或 $LCA (S)$ 。

性质

本节性质部分内容翻译自 wcipeg，并做过修改。

$LCA ({u}) = u$ ;
u 是 v 的祖先，当且仅当 $LCA (u, v) = u$ ;
如果 u 不为 v 的祖先并且 v 不为 u 的祖先，那么 u, v 分别处于 $LCA (u, v)$ 的两棵不同子树中；
====前序遍历中， $LCA (S)$ 出现在所有 S 中元素之前，后序遍历中 $LCA (S)$ 则出现在所有 S 中元素之后====；
两点集并的最近公共祖先为两点集分别的最近公共祖先的最近公共祖先，即 $LCA (A \cup B) = LCA (LCA (A), LCA (B))$ ;
两点的最近公共祖先必定处在树上两点间的最短路上；
$d (u, v) = h (u) + h (v) - 2 h (LCA (u, v))$ ，其中 d 是树上两点间的距离，h 代表某点到树根的距离。

求法

朴素算法

过程

可以每次找深度比较大的那个点，让它向上跳。显然在树上，这两个点最后一定会相遇，相遇的位置就是想要求的 LCA。或者先向上调整深度较大的点，令他们深度相同，然后再共同向上跳转，最后也一定会相遇。

性质

朴素算法预处理时需要 dfs 整棵树，时间复杂度为 $O (n)$ ，单次查询时间复杂度为 $Θ (n)$ 。但由于随机树高为 $O (lo g n)$ ，所以朴素算法在随机树上的单次查询时间复杂度为 $O (lo g n)$ 。

倍增算法

过程

倍增算法是最经典的 LCA 求法，他是朴素算法的改进算法。通过预处理通过预处理 $fa_{x, i}$ 数组，游标可以快速移动，大幅减少了游标跳转次数。 $fa_{x, i}$ 表示点 x 的第 $2^{i}$ 个祖先。 $fa_{x, i}$ 数组可以通过 dfs 预处理出来。

现在我们看看如何优化这些跳转：

在调整游标的第一阶段中，我们要将 u, v 两点跳转到同一深度。我们可以计算出 u, v 两点的深度之差，设其为 y。通过将 y 进行二进制拆分，我们将 y 次游标跳转优化为「y 的二进制表示所含 1 的个数」次游标跳转。
在第二阶段中，我们从最大的 i 开始循环尝试，一直尝试到 0（包括 0），如果 $fa_{u, i} \neq = fa_{v, i}$ ，则 $u \leftarrow fa_{u, i}, v \leftarrow fa_{v, i}$ ，那么最后的 LCA 为 $fa_{u, 0}$ 。

性质

倍增算法的预处理时间复杂度为 $O (n lo g n)$ ，单次查询时间复杂度为 $O (lo g n)$ 。另外倍增算法可以通过交换 fa 数组的两维使较小维放在前面。这样可以减少 cache miss 次数，提高程序效率。

[! note]+ 例题 HDU 2586 How far away? 树上最短路查询。原题为多组数据，以下代码为针对单组数据的情况编写的。

可先求出 LCA，再结合性质 7 进行解答。也可以直接在求 LCA 时求出结果。

//参考代码
#include <cstdio>
#include <cstring>
#include <iostream>
#include <vector>
#define MXN 50007
using namespace std;
std::vector<int> v[MXN];
std::vector<int> w[MXN];
 
int fa[MXN][31], cost[MXN][31], dep[MXN];
int n, m;
int a, b, c;
 
// dfs，用来为 lca 算法做准备。接受两个参数：dfs 起始节点和它的父亲节点。
void dfs(int root, int fno) {
  // 初始化：第 2^0 = 1 个祖先就是它的父亲节点，dep 也比父亲节点多 1。
  fa[root][0] = fno;
  dep[root] = dep[fa[root][0]] + 1;
  // 初始化：其他的祖先节点：第 2^i 的祖先节点是第 2^(i-1) 的祖先节点的第
  // 2^(i-1) 的祖先节点。
  for (int i = 1; i < 31; ++i) {
    fa[root][i] = fa[fa[root][i - 1]][i - 1];
    cost[root][i] = cost[fa[root][i - 1]][i - 1] + cost[root][i - 1];
  }
  // 遍历子节点来进行 dfs。
  int sz = v[root].size();
  for (int i = 0; i < sz; ++i) {
    if (v[root][i] == fno) continue;
    cost[v[root][i]][0] = w[root][i];
    dfs(v[root][i], root);
  }
}
 
// lca。用倍增算法算取 x 和 y 的 lca 节点。
int lca(int x, int y) {
  // 令 y 比 x 深。
  if (dep[x] > dep[y]) swap(x, y);
  // 令 y 和 x 在一个深度。
  int tmp = dep[y] - dep[x], ans = 0;
  for (int j = 0; tmp; ++j, tmp >>= 1)
    if (tmp & 1) ans += cost[y][j], y = fa[y][j];
  // 如果这个时候 y = x，那么 x，y 就都是它们自己的祖先。
  if (y == x) return ans;
  // 不然的话，找到第一个不是它们祖先的两个点。
  for (int j = 30; j >= 0 && y != x; --j) {
    if (fa[x][j] != fa[y][j]) {
      ans += cost[x][j] + cost[y][j];
      x = fa[x][j];
      y = fa[y][j];
    }
  }
  // 返回结果。
  ans += cost[x][0] + cost[y][0];
  return ans;
}
 
int main() {
  // 初始化表示祖先的数组 fa，代价 cost 和深度 dep。
  memset(fa, 0, sizeof(fa));
  memset(cost, 0, sizeof(cost));
  memset(dep, 0, sizeof(dep));
  // 读入树：节点数一共有 n 个。
  scanf("%d", &n);
  for (int i = 1; i < n; ++i) {
    scanf("%d %d %d", &a, &b, &c);
    ++a, ++b;
    v[a].push_back(b);
    v[b].push_back(a);
    w[a].push_back(c);
    w[b].push_back(c);
  }
  // 为了计算 lca 而使用 dfs。
  dfs(1, 0);
  // 查询 m 次，每一次查找两个节点的 lca 点。
  scanf("%d", &m);
  for (int i = 0; i < m; ++i) {
    scanf("%d %d", &a, &b);
    ++a, ++b;
    printf("%d\n", lca(a, b));
  }
  return 0;
}

Tarjan 算法

过程

Tarjan 算法 是一种 离线算法，需要使用 并查集 记录某个结点的祖先结点。做法如下：

首先接受输入边（邻接链表）、查询边（存储在另一个邻接链表内）。查询边其实是虚拟加上去的边，为了方便，每次输入查询边的时候，将这个边及其反向边都加入到 queryEdge 数组里。
然后对其进行一次 DFS 遍历，同时使用 visited 数组进行记录某个结点是否被访问过、parent 记录当前结点的父亲结点。
其中涉及到了 回溯思想，我们每次遍历到某个结点的时候，认为这个结点的根结点就是它本身。让以这个结点为根节点的 DFS 全部遍历完毕了以后，再将 这个结点的根节点 设置为 这个结点的父一级结点。
回溯的时候，如果以该节点为起点，queryEdge 查询边的另一个结点也恰好访问过了，则直接更新查询边的 LCA 结果。
最后输出结果。

性质

Tarjan 算法需要初始化并查集，所以预处理的时间复杂度为 $O (n)$ 。

朴素的 Tarjan 算法处理所有 m 次询问的时间复杂度为 $O (m α (m + n, n) + n)$ ，。但是 Tarjan 算法的常数比倍增算法大。存在 $O (m + n)$ 的实现。

[! warning] 并不存在「朴素 Tarjan LCA 算法中使用的并查集性质比较特殊，单次调用 find () 函数的时间复杂度为均摊 O (1)」这种说法。

以下的朴素 Tarjan 实现复杂度为 $O (m α (m + n, n) + n)$ 。如果需要追求严格线性，可以参考 Gabow 和 Tarjan 于 1983 年的论文。其中给出了一种复杂度为 $O (m + n)$ 的做法。

// 参考代码
#include <algorithm>
#include <iostream>
using namespace std;
 
class Edge {
 public:
  int toVertex, fromVertex;
  int next;
  int LCA;
  Edge() : toVertex(-1), fromVertex(-1), next(-1), LCA(-1){};
  Edge(int u, int v, int n) : fromVertex(u), toVertex(v), next(n), LCA(-1){};
};
 
const int MAX = 100;
int head[MAX], queryHead[MAX];
Edge edge[MAX], queryEdge[MAX];
int parent[MAX], visited[MAX];
int vertexCount, edgeCount, queryCount;
 
void init() {
  for (int i = 0; i <= vertexCount; i++) {
    parent[i] = i;
  }
}
 
int find(int x) {
  if (parent[x] == x) {
    return x;
  } else {
    return find(parent[x]);
  }
}
 
void tarjan(int u) {
  parent[u] = u;
  visited[u] = 1;
 
  for (int i = head[u]; i != -1; i = edge[i].next) {
    Edge& e = edge[i];
    if (!visited[e.toVertex]) {
      tarjan(e.toVertex);
      parent[e.toVertex] = u;
    }
  }
 
  for (int i = queryHead[u]; i != -1; i = queryEdge[i].next) {
    Edge& e = queryEdge[i];
    if (visited[e.toVertex]) {
      queryEdge[i ^ 1].LCA = e.LCA = find(e.toVertex);
    }
  }
}
 
int main() {
  memset(head, 0xff, sizeof(head));
  memset(queryHead, 0xff, sizeof(queryHead));
 
  cin >> vertexCount >> edgeCount >> queryCount;
  int count = 0;
  for (int i = 0; i < edgeCount; i++) {
    int start = 0, end = 0;
    cin >> start >> end;
 
    edge[count] = Edge(start, end, head[start]);
    head[start] = count;
    count++;
 
    edge[count] = Edge(end, start, head[end]);
    head[end] = count;
    count++;
  }
 
  count = 0;
  for (int i = 0; i < queryCount; i++) {
    int start = 0, end = 0;
    cin >> start >> end;
 
    queryEdge[count] = Edge(start, end, queryHead[start]);
    queryHead[start] = count;
    count++;
 
    queryEdge[count] = Edge(end, start, queryHead[end]);
    queryHead[end] = count;
    count++;
  }
 
  init();
  tarjan(1);
 
  for (int i = 0; i < queryCount; i++) {
    Edge& e = queryEdge[i * 2];
    cout << "(" << e.fromVertex << "," << e.toVertex << ") " << e.LCA << endl;
  }
 
  return 0;
}

用欧拉序列转化为 RMQ 问题

定义

对一棵树进行 DFS，无论是第一次访问还是回溯，每次到达一个结点时都将编号记录下来，可以得到一个长度为 2n-1 的序列，这个序列被称作这棵树的欧拉序列。

在下文中，把结点 u 在欧拉序列中第一次出现的位置编号记为 pos(u)（也称作节点 u 的欧拉序），把欧拉序列本身记作 $E [1..2 n - 1]$ 。

过程

有了欧拉序列，LCA 问题可以在线性时间内转化为 RMQ 问题，即 $p os (L C A (u, v)) = min {p os (k) ∣ k \in E [p os (u) .. p os (v)]}$ 。

这个等式不难理解：从 u 走到 v 的过程中一定会经过 LCA(u,v)，但不会经过 LCA(u,v) 的祖先。因此，从 u 走到 v 的过程中经过的欧拉序最小的结点就是 LCA(u, v)。

用 DFS 计算欧拉序列的时间复杂度是 O(n)，且欧拉序列的长度也是 O(n)，所以 LCA 问题可以在 O(n) 的时间内转化成等规模的 RMQ 问题。

实现

参考代码

int dfn[N << 1], pos[N], tot, st[30][(N << 1) + 2],
    rev[30][(N << 1) + 2];  // rev 表示最小深度对应的节点编号
 
void dfs (int cur, int dep) {
  dfn[++tot] = cur;
  depth[tot] = dep;
  pos[cur] = tot;
  for (int i = head[t]; i; i = side[i]. next) {
    int v = side[i]. to;
    if (! pos[v]) {
      dfs (v, dep + 1);
      dfn[++tot] = cur, depth[tot] = dep;
    }
  }
}
 
void init () {
  for (int i = 2; i <= tot + 1; ++i)
    lg[i] = lg[i >> 1] + 1;  // 预处理 lg 代替库函数 log2 来优化常数
  for (int i = 1; i <= tot; i++) st[0][i] = depth[i], rev[0][i] = dfn[i];
  for (int i = 1; i <= lg[tot]; i++)
    for (int j = 1; j + (1 << i) - 1 <= tot; j++)
      if (st[i - 1][j] < st[i - 1][j + (1 << i - 1)])
        st[i][j] = st[i - 1][j], rev[i][j] = rev[i - 1][j];
      else
        st[i][j] = st[i - 1][j + (1 << i - 1)],
        rev[i][j] = rev[i - 1][j + (1 << i - 1)];
}
 
int query (int l, int r) {
  int k = lg[r - l + 1];
  return st[k][l] < st[k][r + 1 - (1 << k)] ? rev[k][l]
                                            : rev[k][r + 1 - (1 << k)];
}

当我们需要查询某点对 (u, v) 的 LCA 时，查询区间 $[min {p os [u], p os [v]}, max {p os [u], p os [v]}]$ 上最小值的所代表的节点即可。

若使用 ST 表来解决 RMQ 问题，那么该算法不支持在线修改，预处理的时间复杂度为 $O (n lo g n)$ ，每次查询 LCA 的时间复杂度为 O(1)。

树链剖分

LCA 为两个游标跳转到同一条重链上时深度较小的那个游标所指向的点。

树链剖分的预处理时间复杂度为 $O (n)$ ，单次查询的时间复杂度为 $O (lo g n)$ ，并且常数较小。

动态树

设连续两次 access 操作的点分别为 u 和 v，则第二次 access 操作返回的点即为 u 和 v 的 LCA.

在无 link 和 cut 等操作的情况下，使用 link cut tree 单次查询的时间复杂度为 $O (lo g n)$ 。

标准 RMQ

前面讲到了借助欧拉序将 LCA 问题转化为 RMQ 问题，其瓶颈在于 RMQ。如果能做到 $O (n) \sim O (1)$ 求解 RMQ，那么也就能做到 $O (n) \sim O (1)$ 求解 LCA。

注意到欧拉序满足相邻两数之差为 1 或者 -1，所以可以使用 $O (n) \sim O (1)$ 的加减 1RMQ 来做。

时间复杂度 $O (n) \sim O (1)$ ，空间复杂度 O(n)，支持在线查询，常数较大。

例题

Luogu P3379【模板】最近公共祖先（LCA）

//参考代码
#include <bits/stdc++.h>
using namespace std;
 
const int N = 5e5 + 5;
 
struct PlusMinusOneRMQ {  // RMQ
  // Copyright (C) 2018 Skqliao. All rights served.
  const static int M = 9;
 
  int blocklen, block, Minv[N], F[N / M * 2 + 5][M << 1], T[N], f[1 << M][M][M],
      S[N];
 
  void init(int n) {  // 初始化
    blocklen = std::max(1, (int)(log(n * 1.0) / log(2.0)) / 2);
    block = n / blocklen + (n % blocklen > 0);
    int total = 1 << (blocklen - 1);
    for (int i = 0; i < total; i++) {
      for (int l = 0; l < blocklen; l++) {
        f[i][l][l] = l;
        int now = 0, minv = 0;
        for (int r = l + 1; r < blocklen; r++) {
          f[i][l][r] = f[i][l][r - 1];
          if ((1 << (r - 1)) & i) {
            now++;
          } else {
            now--;
            if (now < minv) {
              minv = now;
              f[i][l][r] = r;
            }
          }
        }
      }
    }
    T[1] = 0;
    for (int i = 2; i < N; i++) {
      T[i] = T[i - 1];
      if (!(i & (i - 1))) {
        T[i]++;
      }
    }
  }
 
  void initmin(int a[], int n) {
    for (int i = 0; i < n; i++) {
      if (i % blocklen == 0) {
        Minv[i / blocklen] = i;
        S[i / blocklen] = 0;
      } else {
        if (a[i] < a[Minv[i / blocklen]]) {
          Minv[i / blocklen] = i;
        }
        if (a[i] > a[i - 1]) {
          S[i / blocklen] |= 1 << (i % blocklen - 1);
        }
      }
    }
    for (int i = 0; i < block; i++) {
      F[i][0] = Minv[i];
    }
    for (int j = 1; (1 << j) <= block; j++) {
      for (int i = 0; i + (1 << j) - 1 < block; i++) {
        int b1 = F[i][j - 1], b2 = F[i + (1 << (j - 1))][j - 1];
        F[i][j] = a[b1] < a[b2] ? b1 : b2;
      }
    }
  }
 
  int querymin(int a[], int L, int R) {
    int idl = L / blocklen, idr = R / blocklen;
    if (idl == idr)
      return idl * blocklen + f[S[idl]][L % blocklen][R % blocklen];
    else {
      int b1 = idl * blocklen + f[S[idl]][L % blocklen][blocklen - 1];
      int b2 = idr * blocklen + f[S[idr]][0][R % blocklen];
      int buf = a[b1] < a[b2] ? b1 : b2;
      int c = T[idr - idl - 1];
      if (idr - idl - 1) {
        int b1 = F[idl + 1][c];
        int b2 = F[idr - 1 - (1 << c) + 1][c];
        int b = a[b1] < a[b2] ? b1 : b2;
        return a[buf] < a[b] ? buf : b;
      }
      return buf;
    }
  }
} rmq;
 
int n, m, s;
 
struct Edge {
  int v, nxt;
} e[N * 2];
 
int tot, head[N];
 
void init(int n) {
  tot = 0;
  fill(head, head + n + 1, 0);
}
 
void addedge(int u, int v) {  // 加边
  ++tot;
  e[tot] = (Edge){v, head[u]};
  head[u] = tot;
 
  ++tot;
  e[tot] = (Edge){u, head[v]};
  head[v] = tot;
}
 
int dfs_clock, dfn[N * 2], dep[N * 2], st[N];
 
void dfs(int u, int fa, int d) {
  st[u] = dfs_clock;
 
  dfn[dfs_clock] = u;
  dep[dfs_clock] = d;
  ++dfs_clock;
 
  int v;
  for (int i = head[u]; i; i = e[i].nxt) {
    v = e[i].v;
    if (v == fa) continue;
    dfs(v, u, d + 1);
    dfn[dfs_clock] = u;
    dep[dfs_clock] = d;
    ++dfs_clock;
  }
}
 
void build_lca() {  // like init
  rmq.init(dfs_clock);
  rmq.initmin(dep, dfs_clock);
}
 
int LCA(int u, int v) {  // 求解LCA，看题解用RMQ的方法
  int l = st[u], r = st[v];
  if (l > r) swap(l, r);
  return dfn[rmq.querymin(dep, l, r)];
}
 
int main() {
  scanf("%d %d %d", &n, &m, &s);
 
  init(n);
  int u, v;
  for (int i = 1; i <= n - 1; ++i) {
    scanf("%d %d", &u, &v);
    addedge(u, v);
  }
 
  dfs_clock = 0;
  dfs(s, s, 0);
 
  build_lca();
 
  for (int i = 1; i <= m; ++i) {
    scanf("%d %d", &u, &v);
    printf("%d\n", LCA(u, v));
  }
 
  return 0;
}

习题

[! note] 2023 912 算法大题四、算法题（20 分）在以 r 为根的二叉树中，任一节点 v 与 r 之间通路上的所有节点（包括 r 及 v 本身）都成为 v 的祖先。如果节点 a 同时是节点 v 的和 u 的祖先，则称作 v 和 u 的公共祖先（当然 r 是所有节点的公共祖先）其中的深度最大值，称作最低公共祖先（Lowest Common Ancestor）假定存在有 n 个节点的二叉树中，各节点的关键码都是取自 [0,n) 的正数，且彼此互异，尽管不能直接访问该树，但其先序，后序遍历序列已分别记录在数组 P[0,n) 和 Q[0,n) 中，试设计一个算法对 [0,n) 内的任意一对整数关键码 x 和 y，找出它们所对应节点的最低公共祖先 LCA (x, y)，要求算法的运行时间和辅助空间均不超过 O (n) 比如，若 P={3,0,8,5,2,6,7,10,4,1,9}, Q={5,8,2,0,10,4,7,9,1,6,3}，则有 LCA (2,5)=0,LCA (8,4)=3,LCA (6,9)=6

试通过文字与图示，说明算法的原理

试用伪代码描述算法的过程，并提供足够的注释

试证明算法的时间，空间复杂度均符合要求.

思路：其实就是利用一开始提到的性质 4，可以给一个小规模的栈进行模拟：这个图里对前缀、后缀在树中的关系不够准确，但整体意思领会即可。

🌰Senjl's Digital Garden🐉

Recent writing

Welcome to Senj's Digital Garden

2-批处理操作系统

3-多道程序与分时多任务

探索