浅谈线段树(入门)

线段树入门

一、引言

我们在做练习和比赛中,经常能碰见统计类型的题目。题目通过输入数据给程序提供事物信息,并要求程序能比较高效地求出某些时刻,某种情况下,事物的状态是怎样的。这类问题往往比较简单明了,也能十分容易地写出模拟程序。但较大的数据规模使得模拟往往不能满足要求。于是我们就要寻找更好的方法。

本文将介绍解决此类问题的一种方法——线段树。

 

二、线段树

2.1 线段树的结构

线段树是一棵二叉树,其结点是一条“线段”——[a,b],它的左儿子和右儿子分别是这条线段的左半段和右半段,即[a,[(a+b)/2]],[[(a+b)/2],b]线段树的叶子结点是长度为1的单位线段[a,a+1]。下图就是一棵根为[1,10]的线段树:

     

易证一棵以[a,b]为根的线段树结点数是2*(b-a)-1。由于线段树是一棵平衡树,因此一棵以[a,b]为根结点的线段树的深度为log2(2*(b-a))。

线段树中的结点一般采取如下数据结构:

Type TreeNode=Record

              a,b,Left,Right:Longint

            End

 

 其中a,b分别表示线段的左端点和右端点,Left,Right表示左儿子和右儿子的编号。因此我们可以用一个一维数组来表示一棵线段树:

Tree:array[1..Maxn] of TreeNode;

a,b,Left,Right这4个域是描述一棵线段树所必须的4个量。根据实际需要,我们可以增加其它的域,例如增加Cover域来计算该线段被覆盖的次数,bj域用来表示结点的修改标记(后面将会提到)等等。

 

2.2 线段树的建立

我们可以用一个简单的过程建立一棵线段树。

Procedure Insert(Num)

Begin

  If(a<tree[num].a)and(tree[num].b<b)then

Inc(tree[num].cover)

  Else

Begin

  If a<(tree[num].a+tree[num].b)shr 1 then

   Insert(tree[num].left);

  If b>(tree[num].a+tree[num].b)shr 1 then

   Insert(tree[num].right);

End;

End

  

 

 

2.3 线段树中的线段插入和删除

增加一个Cover的域来计算一条线段被覆盖的次数,即数据结构变为:

 
 

Type

TreeNode=Record

         a,b,Left,Right,Cover:Longint

       End

 

因此在MakeTree的时候应顺便把Cover置0。

 

以下是关于线段树插入与删除的操作

1.线段的插入

插入一条线段[a,b]

Procedure Insert(Num)

Begin

  If(a<tree[num].a)and(tree[num].b<b)then

Inc(tree[num].cover)

  Else

Begin

  If a<(tree[num].a+tree[num].b)shr 1 then

   Insert(tree[num].left);

  If b>(tree[num].a+tree[num].b)shr 1 then

   Insert(tree[num].right);

End;

End

  

2.线段的删除

    删除一条线段[a,b]

Procedure delete(num);

Begin

If(a<tree[num].a)and(tree[num].b<b)then

      Dec(tree[num].cover)

Else

     Begin

If a<(tree[num].a+tree[num].b)shr 1 then

    delete(tree[num].left);

If b>(tree[num].a+tree[num].b)shr 1 then

    delete(tree[num].right);

End;

End;

  

 

 (有空附上c++版的)

2.4 线段树的简单应用

掌握了线段树的建立,插入和删除这3条操作,就能用线段树解决一些最基本的统计问题了。例如给出一系列线段[a,b] (0<a<b<10000)覆盖在数轴上,然后求该数轴上共有多少个单位长度[k,k+1]被覆盖了。我们便可以在读入一系列线段[a,b]的时候,同时调用过程Insert(1)。等所有线段都插入完后,就可以进行统计了:

Procedure Count(Num)

Begin

  If Tree[Num].Cover>0 then

      Number:=Number + (Tree[Num].b-Tree[NUM].a)

  Else

     Begin

        Count(Tree[Num].Left);

Count(Tree[Num].Right);

     End

End

 

   像这样的基本静态统计问题,线段树是可以很方便快捷地解决的。但是我们会留意到,如果处理一些动态统计问题,比如说一些需要用到删除和修改的统计,困难就出现了。

 

『例1在数轴上进行一系列操作。每次操作有两种类型,一种是在线段[a,b]上涂上颜色,另一种将[a,b]上的颜色擦去。问经过一系列的操作后,有多少条单位线段[k,k+1]被涂上了颜色。

【输入格式】

    第一行输入2个数a,b(a表示线段为[0,a],0<a<=2000000,b表示有b个操作)

以下从2到b+1行,每行有三个数

第一个表示线段染的颜色(1表示涂色,0表示擦去)

第二个数和第三个数分别表示这个线段区间的上下界。

【输出格式】

一个数字,表示有多少线段被染色

【输入样例1】

6 3

1 2 3

1 2 4

0 4 5

【输出样例1】

2

【输入样例2】

    20 5

    1 1 15

    0 4 9

    1 7 18

    1 7 9

    0 1 3

【输出样例2】

11

这时我们就面临了一个问题——线段的删除。但线段树中线段的删除只能是把已经放入的线段删掉,例如我们没有放置[3,6]这条线段,删除[3,6]就是无法做到的了。而这道题目则不同,例如在[1,15]上涂了颜色,我们可以把[4,9]上的颜色擦去,但线段树中只是插入了[1,15]这条线段,要删除[4,9]这条线段显然是做不到的。因此,我们有必要对线段树进行改进。

 

2.5 线段树的改进

用回刚刚那个例子。给[1,15]涂上色后,再把[4,9]的颜色擦去。很明显[1,15]这条线段已经不复存在,只剩下[1,4]和[9,15],所以我们必须对线段树进行修改,才能使它符合改变了的现实。我们不难想到把[1,15]这条线段删去,再插入线段[1,4]和[9,15]。但事实上并非如此简单。如下图

     若先前我们已经插入了线段[8,11],[1,8]。按上面的做法,只把[1,15]删去,然后插入[1,4],[9,15]的话,[1,8],[8,11]这两条线段并没有删去,但明显与实际不符了。于是[1,8],[8,11]也要修改。这时疑问就来了。若以线段[1,15]为根的整棵线段树中的所有结点之前都已经插入过,即我们曾经这样涂过颜色:[1,2],[2,3],……,[14,15],[1,3],[3,5],……,[13,15],[1,5],…………,[1,15]。然后把[1,15]上的颜色擦去。那么整个线段树中的所有结点的状态就都与实际不符了,全都需要修改。修改的复杂度就是线段树的结点数,即2*(15-1)=28。如果不是[1,15]这样的小线段,而是[1,30000]这样的线段,一个擦除动作就需要O(59998)的复杂度去修改,显然效率十分低(比直接模拟的O(30000)还差)。

为了解决这个问题,我们给线段树的每一个结点增加一个标记域(以下用bj来表示标记域)。增加一个标记域有什么用呢?如下图:

以[1,5]为根的整棵线段树的全部结点都已涂色。现把[1,5]上的颜色擦去。则整棵线段树的结点的状态都与实际不符了。可是我们并不一定要对所有结点都进行修改,因为有些结点以后可能根本不会有被用到的时候。例如我们做完擦去[1,5]的操作之后,只是想询问[3,5]是否有涂上颜色。那么我们对[1,2],[2,3],[1,3],[3,4],[4,5]等线段的修改就变成无用功了。为了避免无用功的出现,我们引入标记域bj。具体操作如下:

1、擦去线段[a,b]之后,给它的左儿子和右儿子都做上标记,令它们的bj=-1。

2、每次访问一条线段,首先检查它是否被标记,若其bj=-1,则进行如下操作:

① 将该线段的状态改为未被覆盖,并把该线段设为未被标记,bj=0。

② 把该线段的左右儿子都设为被标记,bj=-1。

 

对线段[1,5]进行了这样的操作后就不需要对整棵线段树都进行修改了。原理很简单。以线段[3,4]为例。若以后有必要访问[3,4],则必然先访问到它的父亲[3,5],而[3,5]的bj=-1,因此进行①、②的操作后,[3,5]的状态变为未被覆盖,并且把他的标记传递给了他的儿子——[3,4]和[4,5]。接着访问[3,4]的时候,它的bj=-1,我们又把[3,4]的状态变为未被覆盖。可见,标记会顺着访问[3,4]的路一直传递到[3,4],使得我们知道要对[3,4]的状态进行修改,避免了错误的产生。同时,当我们需要用到[3,4]的时候才会进行修改,如果根本不需要用它,修不修改都无所谓了,并不会影响程序的正确性。因此这种方法在保持了正确性的同时有避免了无意义的操作,提高了程序的效率。

进行标记更新的代码如下:

Procedure Clear(Num)

Begin

  Tree[Num].Cover ← 0

  Tree[Num].bj ← 0

  Tree[Tree[Num].Left].bj ← -1

  Tree[Tree[Num].Right].bj ← -1

End

 

程序大致步骤如下:

插入过程 Insert

1、若该线段被标记,则调用Clear过程

2、若线段状态为被涂色,则退出过程(线段已被涂色,无需再插入它或它的子线段)

3、若涂色的区域覆盖了该线段,则该线段的状态变为被涂色,并退出过程

4、若涂色的区域与该线段的左半截的交集非空,则调用左儿子的插入过程

5、若涂色的区域与该线段的右半截的交集非空,则调用右儿子的插入过程

 

删除过程 Delete

1、若该线段被标记,则退出过程(该线段已被赋予被擦除的“义务”,无需再次赋予)

2、若擦除的区域覆盖了该线段,则直接将此时这个节点的标记域值改为-1

退出该过程

3、若该线段的状态为被涂色,则直接调用clear,再插入线段[a,c]和[d,b](若该线段的状态为未被涂色,则线段[a,b]状态为被涂色,而擦除[c,d]相当于把[a,b]整段擦除,再插入[a,c](若a<c)和[d,b](若d<b))

①若擦除区域与该线段的左半截的交集非空,则调用左儿子的擦除过程

②若擦除区域与该线段的右半截的交集非空,则调用右儿子的擦除过程

原文地址:https://www.cnblogs.com/polebug/p/3522025.html