http://www.cnblogs.com/jy02414216/archive/2011/03/04/1970497.html
问题描述:
现在有一数组存放int型整数,数字有重复,且有一数字出现的频率超过了50%,请找出这个数字。
补充:主要考虑数据量很大的情况。
问题求解:
分析:
最直接的方法就是对数组中所有的数字排序,然后再扫描一遍,统计各个数字出现的次数,如果某个数字出现的次数超过一半,则输出这个数字。显然这个算法的时间复杂度是O(N * log2N + N)。
事实上,假如现在数组已经有序,那么数组中间的数字一定是这个要求的数字,所以根本不必扫描。此时算法的时间复杂度是O(N * log2N + 1)。那还能不能再简化一些呢?
我们看到,算法主要的消耗在排序这块,那能否跳过排序这个步骤呢?我们这样想,假如每次删除两个不同的数(不管包括不包括最高频数),那么,在剩下的数字里,原最高频数出现的频率一样超过了50%,不断重复这个过程,最后剩下的将全是同样的数字,即最高频数。此算法避免的排序,时间复杂度只为O(N)。
代码如下:
package Algorithms.frequency; /** * * 给出一堆数,找出其中大于50%平率的数出来 * */ public class Frequency { public static int findMostApperse(int[] num) { int candidate = 0; int count = 0; for (int i = 0; i < num.length; i++){ if (count == 0){ candidate = num[i]; count = 1; }else{ if (candidate == num[i]) count++; else count--; } System.out.println("i="+i+"---"+"num[i]="+num[i]+"---"+ "count="+count+"---"+"candidate="+candidate); } return candidate; } /** * @param args */ public static void main(String[] args) { int []num={1,5,5,3,5,1,5,5,2,3,5}; System.out.println(findMostApperse(num)); } }