舍伍德算法之跳跃表问题

 问题描述

     如果用有序链表来表示一个含有n个元素的有序集S,则在最坏情况下,搜索S中一个元素需要O(n)计算时间。提高有序链表效率的一个技巧是在有序链表的部分结点处增设附加指针以提高其搜索性能在增设附加指针的有序链表中搜索一个元素时,可借助于附加指针跳过链表中若干结点,加快搜索速度。这种增加了向前附加指针的有序链表称为跳跃表。
     应在跳跃表的哪些结点增加附加指针以及在该结点处应增加多少指针完全采用随机化方法来确定。这使得跳跃表可在O(logn)平均时间内支持关于有序集的搜索、插入和删除等运算。 

     例如:如图,(a)是一个没有附加指针的有序表,而图(b)在图(a)的基础上增加了跳跃一个节点的附加指针。图(c)在图(b)的基础上又增加了跳跃3个节点的附加指针。

    在跳跃表中,如果一个节点有k+1个指针,则称此节点为一个k级节点。以图(c)中跳跃表为例,看如何在改跳跃表中搜索元素8。从该跳跃表的最高级,即第2级开始搜索。利用2级指针发现元素8位于节点7和19之间。此时在节点7处降至1级指针进行搜索,发现元素8位于节点7和13之间。最后,在节点7降至0级指针进行搜索,发现元素8位于节点7和11之间,从而知道元素8不在搜索的集合S中。

  相关原理 

       在一般情况下,给定一个含有n个元素的有序链表,可以将它改造成一个完全跳跃表,使得每一个k级结点含有k+1个指针,分别跳过2^k-1,2^(k-1)-1,…,2^0-1个中间结点。第i个k级结点安排在跳跃表的位置i^(2^k)处,i>=0。这样就可以在时间O(logn)内完成集合成员的搜索运算。在一个完全跳跃表中,最高级的结点是级结点

     完全跳跃表与完全二叉搜索树的情形非常类似。它虽然可以有效地支持成员搜索运算,但不适应于集合动态变化的情况。集合元素的插入和删除运算会破坏完全跳跃表原有的平衡状态,影响后继元素搜索的效率。

     为了在动态变化中维持跳跃表中附加指针的平衡性,必须使跳跃表中k级结点数维持在总结点数的一定比例范围内。注意到在一个完全跳跃表中,50%的指针是0级指针;25%的指针是1级指针;…;(100/2^(k+1))%的指针是k级指针。因此,在插入一个元素时,以概率1/2引入一个0级结点,以概率1/4引入一个1级结点,…,以概率1/2^(k+1)引入一个k级结点。另一方面,一个i级结点指向下一个同级或更高级的结点,它所跳过的结点数不再准确地维持在2^i-1。经过这样的修改,就可以在插入或删除一个元素时,通过对跳跃表的局部修改来维持其平衡性。 

     跳跃表中节点的级别在插入是确定,一旦确定便不再更改。下图是遵循上述原则的跳跃表的例子。对其进行搜索与对完全跳跃表所作的搜索是一样的。如果希望在所示跳跃表中插入一个元素8,则应现在跳跃表中搜索其插入位置。经搜索发现应在节点7和11之间插入元素8.此时在节点7和11之间增加1个存储元素8的新节点,并以随机的方式确定新节点的级别。例如,如果元素8是作为一个2级节点插入,则应对图中虚线相交的指针进行调整,如果新插入的节点是一个1级节点,则只要修改2个指针,虚线相交的指针是有可能被修改的指针,这些指针可在搜索元素插入位置时动态地保存起来,以供插入时使用。

  在一个完全跳跃表中,具有i级指针的结点中有一半同时具有i+1级指针。为了维持跳跃表的平衡性,可以事先确定一个实数0<p<1,并要求在跳跃表中维持在具有i级指针的结点中同时具有i+1级指针的结点所占比例约为p。为此目的,在插入一个新结点时,先将其结点级别初始化为0,然后用随机数生成器反复地产生一个[0,1]间的随机实数q。如果q<p,则使新结点级别增加1,直至q>=p。由此产生新结点级别的过程可知,所产生的新结点的级别为0的概率为1-p,级别为1的概率为p(1-p),…,级别为i的概率为p^i(1-p)。如此产生的新结点的级别有可能是一个很大的数,甚至远远超过表中元素的个数。为了避免这种情况,用作为新结点级别的上界。其中n是当前跳跃表中结点个数。当前跳跃表中任一结点的级别不超过 

代码实现:

//随机化算法 跳跃表
#include "stdafx.h"
#include "RandomNumber.h"
#include <cmath>
#include <iostream>
using namespace std;
 
template<class EType,class KType> class SkipList;
template<class EType,class KType>
class SkipNode
{
    friend SkipList<EType,KType>;
    private:
        SkipNode(int size)
        {
            next = new SkipNode<EType,KType>*[size];
        }
        ~SkipNode()
        {
            delete []next;
        }
        EType data;//集合中的元素
        SkipNode<EType,EType> **next;//指针数组 next[i]是第i级指针
};
 
template<class EType,class KType>
class SkipList
{
    public:
        SkipList(KType Large,int MaxE = 10000,float p = 0.5);
        ~SkipList();
        bool Search(const KType& k,EType& e) const;
        SkipList<EType,KType>& Insert(const EType& e);
        SkipList<EType,KType>& Delete(const KType& k,EType& e);
        void Output();
    private:
        int Level();
        SkipNode<EType,KType> *SaveSearch(const KType& k);
        int MaxLevel;                    //跳跃表级别上界
        int Levels;                        //当前最大级别
        RandomNumber rnd;                //随机数产生器
        float Prob;                        //用于分配节点级别
        KType TailKey;                    //元素键值上界
        SkipNode<EType,KType> *head;    //头结点指针
        SkipNode<EType,KType> *NIL;        //尾节点指针
        SkipNode<EType,KType> **last;    //指针数组
};
 
//构造函数
template<class EType,class KType>
SkipList<EType,KType>::SkipList(KType Large,int MaxE,float p)
{
    Prob = p;
    MaxLevel = ceil(log(float(MaxE))/log(1/p))-1;        //初始化跳跃表级别上界
    TailKey = Large;                            //元素键值上界
    Levels = 0;                                    //初始化当前最大级别
 
    //创建头、尾节点和数组 last
    head = new SkipNode<EType,KType>(MaxLevel+1);
    NIL = new SkipNode<EType,KType>(0);
    last = new SkipNode<EType,KType> *[MaxLevel+1];
    NIL->data = Large;
 
    //将跳跃表初始化为空表
    for(int i=0; i<=MaxLevel; i++)
    {
        head->next[i] = NIL;
    }
}
 
//析构函数
template<class EType,class KType>
SkipList<EType,KType>::~SkipList()
{
    SkipNode<EType,KType> *next;
 
    //删除所有节点
    while(head!=NIL)
    {
        next = head->next[0];
        delete head;
        head = next;
    }
 
    delete NIL;
    delete []last;
}
 
class element
{
    friend int main(void);
    public:
        operator long() const 
        {
            return key;
        }
        element& operator = (long y)
        {
            key = y;
            return *this;
        }
    private:
        int data;
        long key;
};
 
//搜索指定元素k
template<class EType,class KType>
bool SkipList<EType,KType>::Search(const KType& k,EType& e) const
{
    if(k>=TailKey)
    {
        return false;
    }
    //位置p恰好位于指定元素k之前
    SkipNode<EType,KType> *p = head;
    for(int i=Levels; i>=0; i--)//逐渐向下搜索
    {
        while(p->next[i]->data<k)//在第i级链中搜索
        {
            p = p->next[i];//每次搜索尽可能滴接近要搜索的元素
        }
    }
    e = p->next[0]->data;
    return (e==k);
}
 
//搜索指定元素k,并将每一级中遇到的上一个节点存放在数组last中
template<class EType,class KType>
SkipNode<EType,KType> *SkipList<EType,KType>::SaveSearch(const KType& k)
{
    //位置p恰好位于指定元素k之前
    SkipNode<EType,KType> *p = head;
    for(int i = Levels; i>=0; i--)
    {
        while(p->next[i]->data<k)
        {
            p = p->next[i];
        }
        last[i] = p;    //上一个第i级结点
    }
    return (p->next[0]);
}
 
//产生不超过MaxLevel 的随机级别
template<class EType,class KType>
int SkipList<EType,KType>::Level()
{
    int lev = 0;
    while(rnd.fRandom()<Prob)
    {
        lev++;
    }
    return (lev<=MaxLevel)?lev:MaxLevel;
}
 
//插入指定元素e
template<class EType,class KType>
SkipList<EType,KType>& SkipList<EType,KType>::Insert(const EType& e)
{
    KType k = e;//取得元素键值
    if(k>=TailKey)
    {
        cout<<"元素键值超界!"<<endl;
        return *this;
    }
    //检查元素是否已存在
    SkipNode<EType,KType> *p = SaveSearch(k);
    if(p->data == e)
    {
        cout<<"元素已存在!"<<endl;
        return *this;
    }
 
    //元素不存在,确定新节点级别
    int lev = Level();
    //调整个级别指针
    if(lev>Levels)
    {
        for(int i=Levels+1; i<=lev; i++)
        {
            last[i] = head;
        }
        Levels = lev;
    }
 
    //产生新节点,并将新节点插入p之后
    SkipNode<EType,KType> *y = new SkipNode<EType,KType>(lev+1);
    y->data = e;
 
    for(int i=0; i<=lev; i++)
    {
        //插入第i级链
        y->next[i] = last[i]->next[i];
        last[i]->next[i] = y;
    }
    return *this;
}
 
//删除键值为k的元素,并将所删除的元素存入e
template<class EType,class KType>
SkipList<EType,KType>& SkipList<EType,KType>::Delete(const KType& k,EType& e)
{
    if(k>=TailKey)
    {
        cout<<"元素键值超界!"<<endl;
    }
    //搜索待删除元素
    SkipNode<EType,KType> *p = SaveSearch(k);
    if(p->data!=k)
    {
        cout<<"未找到待删除元素!"<<endl;
    }
    //从跳跃表中删除节点
    for(int i=0; i<=Levels && last[i]->next[i] == p; i++)
    {
        last[i]->next[i] = p->next[i];
    }
    //更新当前级别
    while(Levels>0 && head->next[Levels] == NIL)
    {
        Levels--;
    }
    e = p->data;
    delete p;
    return *this;
}
 
//输出集合中的元素
template<class EType,class KType>
void SkipList<EType,KType>::Output()
{
    SkipNode<EType,KType> *y = head->next[0];
    for(;y!=NIL; y=y->next[0])
    {
        cout<<y->data<<' ';
    }
    cout<<endl;
}
 
int main()
{
    SkipList<int,int> *s = new SkipList<int,int>(100,10,0.5);
 
    //创建
    cout<<"=========创建==========="<<endl;
 
    int a[] = {5,3,2,11,7,13,19,17,23};
 
    for(int i=0; i<9; i++)
    {
        s->Insert(a[i]);
    }
    s->Output();
 
    //搜索
    cout<<"=========搜索==========="<<endl;
    int k=17,e;
    cout<<"搜索元素k="<<k<<"如下:"<<endl;
    if(s->Search(17,e))
    {
        cout<<"位置搜索结果为:k="<<k<<",e="<<e;
    }
    cout<<endl;
 
    //删除
    cout<<"=========删除==========="<<endl;
    cout<<"删除跳跃表元素k="<<k<<"剩余元素如下:"<<endl;
    s->Delete(k,e);
    s->Output();
 
    delete s;
    return 0;
}
View Code
#include"time.h"
//随机数类
const unsigned long maxshort = 65536L;
const unsigned long multiplier = 1194211693L;
const unsigned long adder = 12345L;
 
class RandomNumber
{
    private:
        //当前种子
        unsigned long randSeed;
    public:
        RandomNumber(unsigned long s = 0);//构造函数,默认值0表示由系统自动产生种子
        unsigned short Random(unsigned long n);//产生0:n-1之间的随机整数
        double fRandom(void);//产生[0,1)之间的随机实数
};
 
RandomNumber::RandomNumber(unsigned long s)//产生种子
{
    if(s == 0)
    {
        randSeed = time(0);//用系统时间产生种子
    }
    else
    {
        randSeed = s;//由用户提供种子
    }
}
 
unsigned short RandomNumber::Random(unsigned long n)//产生0:n-1之间的随机整数
{
    randSeed = multiplier * randSeed + adder;//线性同余式
    return (unsigned short)((randSeed>>16)%n);
}
 
double RandomNumber::fRandom(void)//产生[0,1)之间的随机实数
{
    return Random(maxshort)/double(maxshort);
}
View Code

运行结果:

 效率分析:

当跳跃表中有n个元素时,在最坏情况下,对跳跃表进行搜索,插入和删除运算所需的计算时间均为O(n+maxLevel).在最坏情况下,可能只有一个1个maxLevel级的元素,其余元素均在0级链上。此时跳跃表退化为有序链表。由于跳跃表采用了随机化技术,它的每一种运算在最坏情况下的期望时间均为O(logn)

在一般情况下,跳跃表的一级链上大约有n*p个元素,二级链上大约有n*p^2个元素,......i级链上有n*p^i个元素。因此跳跃表所占用的空间为O(n),特别的,当p=0.5时,约需要2n个指针空间。

参考文献:王晓东《算法设计与分析》第二版

                   https://blog.csdn.net/liufeng_king/article/details/9162409

原文地址:https://www.cnblogs.com/cy0628/p/14010142.html