第六章节 优先队列/堆

一般发送到打印机的作业 放到队列中,但这并不一定是最好的做法 ,比如可能有一个作业很重要,可以先打印,这个时候,就可以用到优先队列。

另外,短的作业一般应该首先完成 ,因此,在运行的程序中,短的作业有更高的优先权。

一、模型

优先队列一定要有的两个操作:insert  ,deleteMin(找到并删除最小的).

其中,insert相当于队列中的enqueue, deleteMin类似于队列中的dequeue.

二、一些简单的实现 

有几种简单的办法可以实现

  • 使用简单的链表

在表头以O(1)进行插入,遍历以O(N)删除最小的.或者使链表保存有序的状态,则insert 要O(N), 而deleteMin要O(1).

  • 使用二权查找树

deleteMin/ insert复杂度都是 O(logN).但是使用插找树有些过份了,因为它还支持很多别的工作,此外,在删除的最坏的情况下,会有失去平衡等问题。

  • 二叉堆

不需要用到链,支持最坏的情形时O(logN),且插入操作平均用时为常数时间。

三、二叉堆

对于优先队列的实现时,使用的很普遍。和二叉查找树一样,堆也有两个性质,结构性与堆序性。对堆的操作可能破坏其中的一个,因此,堆 的操作一定要

到堆的所有性质都满足才终止。

  • 性质结构 

堆是一个完全填满的二叉树。一个完全二叉树可以用数组表示。对一个位置i的元素,左儿子在2i,右儿子在2i+1.父亲在i/2取整数。因此我们不用使用链,而且遍历很简单。唯一的问题是

要先估计大小 。

一个堆结构由一个comparable对象数组与一个代表当前堆大小的整数组成。如下,是一个堆

 

package c6;

public class BinaryHeap<AnyType extends Comparable<? super AnyType>> {
	
	private static final int DEFAULT_CAP=10 ;
	private int currentSize ;
	private AnyType [] array ;
	
	public BinaryHeap(){
		
	}
	public BinaryHeap(int cap){
		
	}
	public BinaryHeap(AnyType [] items){
		currentSize = items.length ;
		array = (AnyType [])new Comparable[(currentSize+2)*11/10];
		int i=1;
		for (AnyType item : items){
			array[i++] = item ;
		}
		buildHeap() ;
	}
	/**
	 * 平均2.6,也就是O(1),最坏insert最小的元素时发生,O(lgN)
	 * @param x
	 */
	public void insert(AnyType x ){
		if (currentSize== array.length-1)
			enlargeArray(array.length*2+1) ;
		
		//percolate up 
		int hole = ++ currentSize ;
		for(; hole>1 && x.compareTo(array[hole/2])<0;hole/=2){
			array[hole] = array[hole/2] ;
		}
		array[hole] =x ;
	}
	public AnyType findMin() throws Exception{
		if (isEmpty())
			throw new Exception() ;
		return array[1] ;//array[0]没有用?
	}
	/**
	 * O(lgN)--最坏和平均都是,因为要percolateDown
	 * @return
	 * @throws Exception
	 */
	public AnyType deleteMin() throws Exception{
		if (isEmpty())
			throw new Exception();
		AnyType minIten = findMin();
		//将array[currentSize]移动到空穴,再将currentSize-1
		array[1] = array[currentSize--] ;
		percolateDown(1) ;
		return minIten ;
	}
	public boolean isEmpty(){
		return currentSize==0 ;//?是否有问题
	}
	public void makeEmpty(){
		
	}
	/**
	 * 删除的时候用到
	 * @param hole 空穴,这里是用的堆最后的一个元素 
	 */
	private void percolateDown(int hole){
		int child ;
		AnyType temp = array[hole] ;
		for (;2*hole<= currentSize;hole = child){
			child = 2*hole;
			//有两儿子时(child!=currentSize),先出两个小的一个
			if (child!= currentSize && array[child+1].compareTo(array[child])<0){
				child++ ;
			}
			//空穴往下滤
			if (array[child].compareTo(temp)<0){
				array[hole] = array[child] ;
			}else {
				break ;
			}
		}
		array[hole] = temp ;
	}
	/**
	 * O(N),这个操作从下而上,不能反
	 */
	private void buildHeap(){
		for (int i= currentSize/2 ;i>0;i--){
			percolateDown(i);
		}
	}
	private void enlargeArray(int newSize){
		
	}
	
}

  

 

  • 堆性质

一个堆中,对于每一个节点X, X的父亲的关键字小于或者等于X中的关键字。因此,最小的元素就在根处。

堆的基本操作

insert 

在下一个可用的位置放一个空穴:

如果 X可以放在这个空穴中,则完成。

如果不可,将空穴的父节点放到 空穴中,这样空穴就上移,直到X能放入空穴为止。

这种操作是上滤。新的元素在堆中上滤直到找到正确的位置。

如果插入的是最小元素,则要上滤到根处,将用时O(logN),平均来看,性能好很多,插入一次只要2.6次比较。性能好很多。

deleteMin 

找到最小元素是简单的,但是删除比较复杂。

当删除一个最小元素时,根处出现 一个空穴,由于现在堆少了一个元素,因此堆中的最后一个元素X要移动到一个地方。

如果X可以直接放到空穴中,删除完成 。

如果不可以,将空穴的两儿子中小的移动到空穴,这样空穴下滤一层,重复上过程直到X可放到空穴中。

因此 ,做法就是将X放到沿着根开始,有最小儿子的一条路径 上的一个正确 的路径上。

对于一个节点如果只有一个儿子,我们要进行附加的测试,

这种操作的最坏情况运行时间为O(logN),平均来说,也是O(logN).

其它操作

事实上一个堆所蕴含的有序信息很少,如果不对整个堆进行线性搜索,是没有办法找到任何特定的关键字的。

buildHeap操作

可以将N个元素insert到一个空堆中,每一个insert将花费O(1)的平均时间和O(logN)的最坏时间,因此整个过和将花费O(N)平均时间,而不是O(NlogN)最坏时间。这是一种特殊的指令,没有

别的操作干扰。

一般的算法 是将N项以任意的顺序放到树中,保持结构特性,然后再percolatedown (i),以构造一个堆序的树。

四、优先队列的使用

选择问题

从N个元素中找出第k个最大的元素。下面给出两个在 k=N/2时,最坏以O(NlogN)运行的算法 。

算法1

只考虑找到第k个最小的元素,将N个元素读入数组,进行buildHeap算法 ,最后,进行k次deleteMin,得到结果。使用的时间为

O(N+k*logN)。如果 k很大,则为O(klogN),如果 k=N/2则为O(NlogN).如k=N,则相当于给N个元素进行了排序。

算法2

我们维持一个大小为k的堆,根元素就是这个小集合中最小的,再读入一个新的元素,与根进行比较。(略)。

除了不能进行find操作,堆最大的缺点是将两个堆合并是一个很困难的操作。下面讨论几个可以支持以O(NlogN)的时间进行merge的数据结构。

原文地址:https://www.cnblogs.com/chuiyuan/p/4524069.html