面试题:找出数组中出现次数超过一半的数

算法内容来源于网络,本人增加对算法的证明。

百度面试题现在有一个数组,已知一个数出现的次数超过了一半,请用O(n)的复杂度的算法找出这个数。
  答案1:
  创建一个hash_map,key为数组中的数,value为此数出现的次数。遍历一遍数组,用hash_map统计每个数出现的次数,并用两个值存储目前出现次数最多的数和对应出现的次数。
  这样可以做到O(n)的时间复杂度和O(n)的空间复杂度,满足题目的要求。
  但是没有利用“一个数出现的次数超过了一半”这个特点。也许算法还有提高的空间。
  
  答案2:  
  使用两个变量A和B,其中A存储某个数组中的数,B用来计数。开始时将B初始化为0。  
  遍历数组,如果B=0,则令A等于当前数,令B等于1;如果当前数与A相同,则B=B+1;如果当前数与A不同,则令B=B-1。遍历结束时,A中的数就是要找的数。
  这个算法的时间复杂度是O(n),空间复杂度为O(1)。

算法2证明:采用反证法。

假设超过一般的数为x,采用算法2最终得到的结果为y(y!=x),从k+1位置(数组元素从1开始)开始,A一直是y

则[1,k]元素中含有x的个数n(x) <= k/2,

[k+1, n]元素中含有x的个数l(x) = total(x) - n(x) >= (n+1)/2 - k/2  > (n-k)/2

因此在[k+1, n]中,x的个数超过了一半,A的最后结果不可能是y。

因此假设不成立,所以y=x。

原文地址:https://www.cnblogs.com/simonote/p/3087178.html