树Hash

我们有时需要判断一些树是否同构。这时，选择恰当的Hash方式来将树映射成一个便于储存的Hash值（一般是 32 位或 64 位整数）是一个优秀的方案。

树Hash定义在有根树上。判断无根树同构的时候，可以比较重心为根的Hash值或者比较每个点为根的Hash值。

树哈希有很多种哈希方式，下面介绍其中一种：

$f_x$表示$x$为根的子树的Hash值，$son_x$表示$x$的儿子结点集合，$size_y$表示$y$为根的子树规模，$prime(i)$表示第$i$个素数，则

$$
f_x = 1 + sum_{yin son_x}{f_y imes prime(size_y)}
$$

注意到我们求得的是子树的Hash值，也就是说只有当根一样时同构的两棵子树 hash 值才相同。如果数据范围较小，我们可以暴力求出以每个点为根时的Hash值，也可以通过up and down树形dp的方式，遍历树两遍求出以每个点为根时的Hash值，排序后比较。

如果数据范围较大，我们可以通过找重心的方式来优化复杂度。（一棵树的重心最多只有两个，分别比较即可）

例题1：洛谷P5043 [模板]树同构

判断无根树同构，通过两遍dfs树形dp，求出每个点为根时的Hash值，排序后比较即可。

#include <cstdio>
#include <cstring>
#include <vector>
#include <algorithm>
using std::vector;
using std::sort;
const int N = 60;
int f[N], g[N], siz[N];
int n;
struct Edge
{
    int nex, to;
} edge[N<<1];
int head[N], tot;
vector<int> hs[N];
bool isprime[1000];
int prime[N];
void init(int i) {
    tot = 1;
    memset(head, 0, sizeof(head));
    hs[i].clear();
}
void add_edge(int u, int v) {
    edge[tot].to = v;
    edge[tot].nex = head[u];
    head[u] = tot++;
}
void get_prime(int MAX) {
    int x = 0;
    memset(isprime, true, sizeof(isprime));
    for (int i = 2; i < MAX; i++) {
        if (x > 55) break;
        if (isprime[i]) prime[x++] = i;
        for (int j = 0; j < x; j++) {
            if (i * prime[j] >= MAX) break;
            isprime[i * prime[j]] = 0;
            if (i % prime[j] == 0) break;
        }
    }
}
void dfs1(int x, int fa) {
    siz[x] = f[x] = 1;
    for (int i = head[x]; i; i = edge[i].nex) {
        int y = edge[i].to;
        if (y == fa) continue;
        dfs1(y, x);
        f[x] += f[y] * prime[siz[y]];
        siz[x] += siz[y];
    }
}
void dfs2(int x, int fa, int fa_f) {
    g[x] = f[x] + fa_f * prime[n-siz[x]];
    fa_f *= prime[n-siz[x]];
    for (int i = head[x]; i; i = edge[i].nex) {
        int y = edge[i].to;
        if (y == fa) continue;
        dfs2(y, x, fa_f + f[x] - f[y] * prime[siz[y]]);
    }
}
bool Equal(int x, int y) {
    if (hs[x].size() != hs[y].size()) return false;
    for (int i = 0; i < hs[x].size(); i++) {
        if (hs[x][i] != hs[y][i]) return false;
    }
    return true;
}

int main() {
    get_prime(1000);
    int m;
    while (~scanf("%d", &m)) {
        for (int i = 1; i <= m; i++) {
            init(i);
            scanf("%d", &n);
            for (int j = 1, x; j <= n; j++) {
                scanf("%d", &x);
                if (x) add_edge(x, j), add_edge(j, x);
            }
            dfs1(1, 0);
            dfs2(1, 0, 0);
            for (int j = 1; j <= n; j++) hs[i].push_back(g[j]);
            sort(hs[i].begin(), hs[i].end());
        }
        puts("1");
        for (int i = 2; i <= m; i++) {
            for (int j = 1; j <= i; j++) {
                if (Equal(i, j)) {
                    printf("%d
", j);
                    break;
                }
            }
        }
    }
    return 0;
}

View Code

贴一个树重心为根求Hash值进行比较的代码，用了其他Hash方法：

inline void DFS(re int x,re int fa){
    size[x]=1;
    re int i,y,res=0;
    for(i=h[x];i;i=e[i].next){
        y=e[i].to;if(y==fa)continue;
        DFS(y,x);
        size[x]+=size[y];
        res=max(res,size[y]);
    }
    res=max(res,n-size[x]);d[x]=res;
    maxl=min(maxl,res);
}
inline int Solve(re int x,re int fa){
    re int i,y,res=2333;
    re vector<int > t;
    for(i=h[x];i;i=e[i].next){
        y=e[i].to;if(y==fa)continue;
        t.push_back(Solve(y,x));
    }
    sort(t.begin(),t.end());
    for(i=0;i<t.size();++i)res=((res*Mul)^t[i])%Mod;
    return res;
}
int main(void){
    re int i,j,x;
    scanf("%d",&m);
    memset(ans,INF,sizeof ans);
    for(i=1;i<=m;++i){
        scanf("%d",&n);
        cnt=0;memset(h,0,sizeof h);tot=0;
        for(j=1;j<=n;++j){scanf("%d",&x);if(x){AddEdge(j,x);AddEdge(x,j);}}
        maxl=INF;DFS(1,0);
        for(j=1;j<=n;++j){if(d[j]==maxl)rt[++tot]=j;}
        for(j=1;j<=tot;++j)ans[i]=min(ans[i],Solve(rt[j],0));
        for(j=1;j<=i;++j)if(ans[j]==ans[i]){printf("%d
",j);break;}
    }
    return 0;
}

View Code

例题2：洛谷P4323[JSOI2016] 独特的树叶

处理出树A每个点为根时的Hash值，放进set里；

处理出树B每个点为根时的Hash值，对于叶子结点，计算其父亲结点为根，去掉此叶子结点后的Hash值（也就是减去第一个素数2），在set中查找是否存在此值，是则说明此叶子结点为多余的叶子。

#include <cstdio>
#include <cstring>
#include <unordered_set>
using std::unordered_set;
const int N = 100010;
bool isprime[2000010];
int prime[N];
int in[N], near[N];
struct Edge
{
    int nex, to;
};
struct Tree
{
    int f[N], g[N], siz[N], head[N];
    int n, tot;
    Edge edge[N<<1];
    void init(int nn) {
        n = nn;
        tot = 1;
        memset(head, 0, sizeof(head));
    }
    void add_edge(int u, int v) {
        edge[tot].to = v;
        edge[tot].nex = head[u];
        head[u] = tot++;
    }
    void dfs1(int x, int fa) {
        siz[x] = f[x] = 1;
        for (int i = head[x]; i; i = edge[i].nex) {
            int y = edge[i].to;
            if (y == fa) continue;
            dfs1(y, x);
            f[x] += f[y] * prime[siz[y]];
            siz[x] += siz[y];
        }
    }
    void dfs2(int x, int fa, int fa_f) {
        g[x] = f[x] + fa_f * prime[n-siz[x]];
        fa_f *= prime[n-siz[x]];
        for (int i = head[x]; i; i = edge[i].nex) {
            int y = edge[i].to;
            if (y == fa) continue;
            dfs2(y, x, fa_f + f[x] - f[y] * prime[siz[y]]);
        }
    }
} tree1, tree2;
void get_prime(int MAX) {
    int x = 1;
    memset(isprime, true, sizeof(isprime));
    for (int i = 2; i < MAX; i++) {
        if (x > N - 5) break;
        if (isprime[i]) prime[x++] = i;
        for (int j = 1; j < x; j++) {
            if (i * prime[j] >= MAX) break;
            isprime[i * prime[j]] = 0;
            if (i % prime[j] == 0) break;
        }
    }
}

int main() {
    get_prime(2000010);
    int n;
    while (~scanf("%d", &n)) {
        tree1.init(n);
        tree2.init(n + 1);
        memset(in, 0, sizeof(in));
        unordered_set<int> se;
        for (int i = 0, u, v; i < n - 1; i++) {
            scanf("%d %d", &u, &v);
            tree1.add_edge(u, v);
            tree1.add_edge(v, u);
        }
        for (int i = 0, u, v; i < n; i++) {
            scanf("%d %d", &u, &v);
            tree2.add_edge(u, v);
            tree2.add_edge(v, u);
            ++in[u], ++in[v];
            near[u] = v, near[v] = u;
        }
        tree1.dfs1(1, 0);
        tree1.dfs2(1, 0, 0);
        for (int i = 1; i <= n; i++) se.insert(tree1.g[i]);
        tree2.dfs1(1, 0);
        tree2.dfs2(1, 0, 0);
        for (int i = 1; i <= n + 1; i++) {
            if (in[i] != 1) continue;
            if (se.count(tree2.g[near[i]] - 2)) {
                printf("%d
", i);
                break;
            }
        }
    }
    return 0;
}

View Code