第六章节优先队列/堆

一般发送到打印机的作业放到队列中，但这并不一定是最好的做法，比如可能有一个作业很重要，可以先打印，这个时候，就可以用到优先队列。

另外，短的作业一般应该首先完成，因此，在运行的程序中，短的作业有更高的优先权。

一、模型

优先队列一定要有的两个操作：insert ，deleteMin(找到并删除最小的).

其中，insert相当于队列中的enqueue, deleteMin类似于队列中的dequeue.

二、一些简单的实现

有几种简单的办法可以实现

使用简单的链表

在表头以O(1)进行插入，遍历以O(N)删除最小的.或者使链表保存有序的状态，则insert 要O(N), 而deleteMin要O(1).

使用二权查找树

deleteMin/ insert复杂度都是 O(logN).但是使用插找树有些过份了，因为它还支持很多别的工作，此外，在删除的最坏的情况下，会有失去平衡等问题。

二叉堆

不需要用到链，支持最坏的情形时O(logN),且插入操作平均用时为常数时间。

三、二叉堆

对于优先队列的实现时，使用的很普遍。和二叉查找树一样，堆也有两个性质，结构性与堆序性。对堆的操作可能破坏其中的一个，因此，堆的操作一定要

到堆的所有性质都满足才终止。

性质结构

堆是一个完全填满的二叉树。一个完全二叉树可以用数组表示。对一个位置i的元素，左儿子在2i,右儿子在2i+1.父亲在i/2取整数。因此我们不用使用链，而且遍历很简单。唯一的问题是

要先估计大小。

一个堆结构由一个comparable对象数组与一个代表当前堆大小的整数组成。如下，是一个堆

package c6;

public class BinaryHeap<AnyType extends Comparable<? super AnyType>> {
	
	private static final int DEFAULT_CAP=10 ;
	private int currentSize ;
	private AnyType [] array ;
	
	public BinaryHeap(){
		
	}
	public BinaryHeap(int cap){
		
	}
	public BinaryHeap(AnyType [] items){
		currentSize = items.length ;
		array = (AnyType [])new Comparable[(currentSize+2)*11/10];
		int i=1;
		for (AnyType item : items){
			array[i++] = item ;
		}
		buildHeap() ;
	}
	/**
	 * 平均2.6,也就是O(1)，最坏insert最小的元素时发生，O(lgN)
	 * @param x
	 */
	public void insert(AnyType x ){
		if (currentSize== array.length-1)
			enlargeArray(array.length*2+1) ;
		
		//percolate up 
		int hole = ++ currentSize ;
		for(; hole>1 && x.compareTo(array[hole/2])<0;hole/=2){
			array[hole] = array[hole/2] ;
		}
		array[hole] =x ;
	}
	public AnyType findMin() throws Exception{
		if (isEmpty())
			throw new Exception() ;
		return array[1] ;//array[0]没有用?
	}
	/**
	 * O(lgN)--最坏和平均都是,因为要percolateDown
	 * @return
	 * @throws Exception
	 */
	public AnyType deleteMin() throws Exception{
		if (isEmpty())
			throw new Exception();
		AnyType minIten = findMin();
		//将array[currentSize]移动到空穴，再将currentSize-1
		array[1] = array[currentSize--] ;
		percolateDown(1) ;
		return minIten ;
	}
	public boolean isEmpty(){
		return currentSize==0 ;//?是否有问题
	}
	public void makeEmpty(){
		
	}
	/**
	 * 删除的时候用到
	 * @param hole 空穴，这里是用的堆最后的一个元素 
	 */
	private void percolateDown(int hole){
		int child ;
		AnyType temp = array[hole] ;
		for (;2*hole<= currentSize;hole = child){
			child = 2*hole;
			//有两儿子时(child!=currentSize)，先出两个小的一个
			if (child!= currentSize && array[child+1].compareTo(array[child])<0){
				child++ ;
			}
			//空穴往下滤
			if (array[child].compareTo(temp)<0){
				array[hole] = array[child] ;
			}else {
				break ;
			}
		}
		array[hole] = temp ;
	}
	/**
	 * O(N)，这个操作从下而上，不能反
	 */
	private void buildHeap(){
		for (int i= currentSize/2 ;i>0;i--){
			percolateDown(i);
		}
	}
	private void enlargeArray(int newSize){
		
	}
	
}

堆性质

一个堆中，对于每一个节点X, X的父亲的关键字小于或者等于X中的关键字。因此，最小的元素就在根处。

堆的基本操作

insert

在下一个可用的位置放一个空穴：

如果 X可以放在这个空穴中，则完成。

如果不可，将空穴的父节点放到空穴中，这样空穴就上移，直到X能放入空穴为止。

这种操作是上滤。新的元素在堆中上滤直到找到正确的位置。

如果插入的是最小元素，则要上滤到根处，将用时O(logN)，平均来看，性能好很多，插入一次只要2.6次比较。性能好很多。

deleteMin

找到最小元素是简单的，但是删除比较复杂。

当删除一个最小元素时，根处出现一个空穴，由于现在堆少了一个元素，因此堆中的最后一个元素X要移动到一个地方。

如果X可以直接放到空穴中，删除完成。

如果不可以，将空穴的两儿子中小的移动到空穴，这样空穴下滤一层，重复上过程直到X可放到空穴中。

因此，做法就是将X放到沿着根开始，有最小儿子的一条路径上的一个正确的路径上。

对于一个节点如果只有一个儿子，我们要进行附加的测试，

这种操作的最坏情况运行时间为O(logN),平均来说，也是O(logN).

其它操作

事实上一个堆所蕴含的有序信息很少，如果不对整个堆进行线性搜索，是没有办法找到任何特定的关键字的。

buildHeap操作

可以将N个元素insert到一个空堆中，每一个insert将花费O（1）的平均时间和O(logN)的最坏时间，因此整个过和将花费O(N)平均时间，而不是O(NlogN)最坏时间。这是一种特殊的指令，没有

别的操作干扰。

一般的算法是将N项以任意的顺序放到树中，保持结构特性，然后再percolatedown (i)，以构造一个堆序的树。

四、优先队列的使用

选择问题

从N个元素中找出第k个最大的元素。下面给出两个在 k=N/2时，最坏以O(NlogN)运行的算法。

算法1

只考虑找到第k个最小的元素，将N个元素读入数组，进行buildHeap算法，最后，进行k次deleteMin，得到结果。使用的时间为

O(N+k*logN)。如果 k很大，则为O(klogN),如果 k=N/2则为O(NlogN).如k=N，则相当于给N个元素进行了排序。

算法2

我们维持一个大小为k的堆，根元素就是这个小集合中最小的，再读入一个新的元素，与根进行比较。（略）。

除了不能进行find操作，堆最大的缺点是将两个堆合并是一个很困难的操作。下面讨论几个可以支持以O(NlogN)的时间进行merge的数据结构。

第六章节 优先队列/堆

第六章节优先队列/堆