Splay算法详解

本篇随笔浅谈一下算法竞赛中的(Splay)算法。

Splay的概念

Splay在我看来应该算作一种算法而非数据结构。无论是Treap，AVL，SBT，替罪羊树还是Splay其实都应该算作算法，因为它们都在解决一种数据结构存在的问题：二叉搜索树(BST)。

对于二叉搜索树和Treap（平衡树概念）不了解的，可以移步下面两篇博客：

浅谈二叉搜索树

详解Treap

有了前置知识，我们可以发现问题的根源在于(BST)在数据极端的情况下会退化成链。而什么Treap啊，AVL啊，SBT啊，Splay啊，替罪羊树啊都是在干一件事情：如何让这棵树尽可能平衡，不要退化成链。

有个叫做Tarjan的大佬YY出了Splay这种算法。

Splay的实现方式

Treap的实现原理在于为所有节点附加一个键值。这个键值按堆的形式排序。让整个数据结构在节点权值上是BST，但在优先级（键值）上却是一个堆。

但Splay的实现方式是对节点的序号进行重构，从而达到平衡树要求的标准。

splay操作

splay操作是指将一个点一直上旋，知道某个指定点。默认是根节点。

Splay的精髓在于旋转，这已经是不争的事实了。

如果对于树的旋转这个知识点有些不明白，请移步Treap的博客：

Treap详解

相比于Treap只有单旋这一种旋转方式，Splay的优秀之处在于它有着4种旋转方式：单旋和双旋。

什么是双旋？为什么要双旋？

双旋的适用范围在于：祖父、父亲和儿子节点连成一条线。

就像这样：

1595832450131

如果这样的结构不去双旋而简单粗暴地用两次单旋（先将需要旋转的节点上旋，再转他的父亲）来解决，最后造成的结果就像是右边的样子（自己手画模拟一下两次单旋即可发现）。我们发现，左侧的树是四层，右侧的树仍然是四层：对于复杂度来讲，没有任何优化。因为我们的平衡树是尽量把复杂度变成(log)级别的。

那么，我们就需要使用双旋。双旋的操作方式是：先将父节点上旋，再将需要旋转的节点上旋。别看这个双旋只是改变了其旋转顺序，但是可是大有文章，经过这样的旋转策略，最终的旋转结果就变成了这样：

1595833252570

嗯，不错，少了一层，看起来很平衡。

所以，我们的Splay的精华是Splay操作，也就是把某个节点一直转到根节点，顺道改变整棵树的形态。具体实现方式是：如果当前节点的父亲节点就是根节点或者自己、父亲、祖父不在一条直线上，就单旋；如果自己、父亲、祖父正好在同一条直线上，那么就双旋：双旋的策略是：先转父亲后转自己。

所以我们有四种旋转方式：单旋左旋，单旋右旋，双旋左旋，双旋右旋。

这也是Splay的基本操作。

Splay和Treap在旋转上的区别

学过Treap的小伙伴（包括我）都在觉得Splay的单旋和Treap的左右旋好像是一样的。但是实际上它们却有所不同。在本蒟蒻的理解上，这种不同体现在“对象”上。

Treap的旋转是将儿子节点旋到自己的位置。左旋是把右儿子转到自己的位置，右旋是把左儿子转到自己的位置。

但是Splay的旋转则是将自己转到父亲节点的位置，虽然形式上都是上旋，但是作用对象是不一样的。

Splay的代码实现

一般来讲，Splay支持的操作和Treap是差不多的。其实所有的平衡树都是这种操作。动态插入删除，然后去动态查询第k大、数的排名、前驱、后继等等。因为平衡树的本质是BST，所以BST所拥有的性质，Splay全都可以支持和维护。

就拿洛谷的例题来讲吧：P3369的模板。

题目传送门

前置信息

前置信息包括三个函数：maintain函数（来维护节点的size，后期统计排名用），get函数（确认当前节点是它爹的左儿子还是右儿子，旋转要用）以及find函数（在树中找到某个值的节点位置）

void maintain(int x)
{
    size[x]=cnt[x]+size[ch[x][0]]+size[ch[x][1]];
}
int find(int x)
{
    int pos=root;
    while(val[pos]!=x)
        pos=ch[pos][x>val[pos]];
    return pos;
}
int get(int x)
{
    int f=fa[x];
    return ch[f][1]==x;
}

代码很简单，应该一看就能懂。

旋转&Splay操作

上面的Splay的实现原理就在讲旋转和Splay操作的原理。依照上面讲的模拟即可得到下面的模板：

void rotate(int x)
{
    int y=fa[x],z=fa[y];
    int k=get(x);//k表示x是y的什么儿子
    ch[y][k]=ch[x][k^1],fa[ch[y][k]]=y;
    ch[x][k^1]=y,fa[y]=x,fa[x]=z;
    if(z)
        ch[z][ch[z][1]==y]=x;
    maintain(y),maintain(x);
}
void splay(int x,int &goal)
{
    int f=fa[goal];
    while(fa[x]!=f)
    {
        if(fa[fa[x]]!=f)
            rotate(get(x)==get(fa[x])?fa[x]:x);
        rotate(x);
    }
    goal=x;
}

插入

插入的时候需要一个动态开点。也就是用到哪开到哪，所以一开始首先要判整棵树是不是空的。然后再去进行插入。插入的时候要注意：因为有些数可以重复出现。所以当我们在原树中找到与插入节点完全相同的节点之后，不用去插入，直接把计数变量+1就可。

如果这是一个全新的节点，那么它一定是个叶子。所以如果我们没在原树中找到这个节点的话，就得用动态开点把点加进去。

动态开点不太会的小伙伴走这边：

浅谈动态开点

插入要注意两点：第一点是maintain，也就是统计节点的大小。第二点是Splay，每次插入和删除之后都要Splay，来维护树的形态。这也是Splay算法的精髓所在，一定不要忽略。这两种操作应该maintain在前，splay在后，因为在进入splay之前要保证当前状态下所有节点的信息都是对的，才能保证Splay之后所有节点的信息也都是对的。

插入代码：

void insert(int x)
{
    if(!root)
    {
        ++tot;
        root=tot;
        val[root]=x;
        cnt[root]=1;
        maintain(root);
        return;
    }
    int pos,f;
    pos=f=root;
    while(pos && val[pos]!=x)
        f=pos,pos=ch[pos][x>val[pos]];
    if(!pos)
    {
        ++tot;
        cnt[tot]=1;
        val[tot]=x;
        fa[tot]=f;
        ch[f][x>val[f]]=tot;
        maintain(tot);
        splay(tot,root);
        return;
    }
    ++cnt[pos];
    maintain(pos);
    splay(pos,root);
}

删除

删除的操作其实和Treap的有些像，但是又有些不同。作为一个树中节点来讲，尤其是一个BST的节点，我们肯定不能直接上来就暴力删掉这个节点，否则无法维护BST的性质。为了解决这个问题，我们选择把节点直接Splay转到根节点，这样的话，直接删根对左右子树是无影响的，直接合并就好。

但是要分几种情况讨论：（Splay之后）

首先，如果这个点有很多数，但是我们只删一个，所以直接cnt-1就可，其他不用变。

如果只有一个，那么就要删除，但是删除之后谁来当根节点呢？这又有三种情况可以讨论：根节点只有左儿子，根节点只有右儿子，根节点儿女双全。

前两种只能给唯一的儿子。如果儿女双全，就得在删掉当前根节点后再找一个根节点，但是问题来了，新的根节点到底是用左儿子合适还是用右儿子合适？

都不合适。根据BST的性质，因为左子树都比当前节点小，右子树都比当前节点大，所以我们选择根节点左子树中最大的点作为根节点（就是根节点向左，然后一直向右到头）。

别忘了Splay维护和maintain更新。

代码：

void del(int x)
{
    int pos=find(x);
    splay(pos,root);
    if(cnt[root]>1)
    {
        cnt[root]--;
        maintain(root);
        return;
    }
    if((!ch[root][0])&&(!ch[root][1]))
        root=0;
    else if(!ch[root][0])
        root=ch[root][1],fa[root]=0;
    else if(!ch[root][1])
        root=ch[root][0],fa[root]=0;
    else
    {
        pos=ch[root][0];
        while(ch[pos][1])
            pos=ch[pos][1];
        splay(pos,ch[root][0]);
        ch[pos][1]=ch[root][1];
        fa[ch[root][1]]=pos,fa[pos]=0;
        maintain(pos);
        root=pos;
    }
}

查询排名

当然可以用BST的性质来遍历树计算排名。但是好笨的样子。

我们会Splay啊，直接把要查的节点Splay上去，然后直接调用其左子树的size+1不就可以了嘛！

int rank(int x)
{
    int pos=find(x);
    splay(pos,root);
    return size[ch[root][0]]+1;
}

查询第k大

int kth(int x)
{
    int pos=root;
    while(1)
    {
        if(x<=size[ch[pos][0]])
            pos=ch[pos][0];
        else 
        {
            x-=(size[ch[pos][0]]+cnt[pos]);
            if(x<=0)
            {
                splay(pos,root);
                return val[pos];
            }
            pos=ch[pos][1];
        }
    }
}

查询前驱/后继

前驱和后继的定义已经给出。我们惊喜地发现和BST的性质真的是无比的契合。

所以我们直接用BST查就可以，任何平衡树算法都是一样的。

代码：

int pre(int x)//前驱
{
    int ans;
    int pos=root;
    while(pos)
    {
        if(x>val[pos])
        {
            ans=val[pos];
            pos=ch[pos][1];
        }
        else
            pos=ch[pos][0];
    }
    return ans;
}
int nxt(int x)//后继
{
    int ans;
    int pos=root;
    while(pos)
    {
        if(x<val[pos])
        {
            ans=val[pos];
            pos=ch[pos][0];
        }
        else
            pos=ch[pos][1];
    }
    return ans;
}