《编程之美》——寻找发帖“水王”学习与扩展
问题描述(难度 ):
传说,Tango有一大“水王”,他不但喜欢发贴,还会回复其他ID发的每个帖子。坊间风闻该“水王”发帖数目超过了帖子总数的一半。如果你有一个当前论坛上所有帖子(包括回帖)的列表,其中帖子作者的ID也在表中,你能快速找出这个传说中的Tango水王吗?方法一:
先对ID列表进行排序,由于“水王ID”出现次数超过总次数的一半,则有序ID列表的第N/2项(从0开始编号)一定是“水王”的ID。算法复杂度为排序的复杂度O(N*log2N)。
方法二:
避免排序。每次去掉两个不同的ID,不断缩小问题规模,而又可以保证水王的ID保持占总数的1/2以上,时间复杂度仅为O(N)。代码的写法也有技巧,并不是真正删除列表中的ID,而是使用一个计数器nTimes和一个Candidate记录ID来实现。在遍历一次列表的过程中,如果遇到和candidate相同的元素,则nTimes+1;如果遇到和candiate不同的元素,则计数器-1;如果计数器的值=0,则把下一个a[i]赋给candidate,相当于把之前的所有元素都删除了,这些元素是两两不同的;最后留下的candidate的值就是水王的ID。书中附的伪代码如下:
Type Find(Type* ID, int N) { Type candidate; int nTimes, i; for(i = nTimes = 0; i < N; i++) { if(nTimes == 0) { candidate = ID[i], nTimes = 1; } else { if(candidate == ID[i]) nTimes++; else nTimes--; } } return candidate; }
扩展问题
随着Tango的发展,管理员发现,“超级水王”没有了。统计结果表明,有3个发帖很多的ID,他们的发帖数目都超过了帖子总数目N的1/4。你能从发帖ID列表中快速找出他们的ID吗?
同样采取方法2的思想,实现代码(C++)如下:
#includeusing namespace std;/*扩展问题:假如有3个发帖很多的ID,他们的发帖总数都超过看1/4,快速找出他们的ID。思路:分别用三个计数器(T1,T2,T3)记录3个Candidate(C1,C2,C3),如果出现相同元素,则对应的计数器+1,如果元素与三个Candidate都不相同,则三个计数器均-1;当计数器为0时,则将i++后的a[i]值赋给相应的Candidate,这样就相当于去掉了4(或4的整数倍)个不同的ID,使问题规模缩小,而3个Candidate所占的比例仍然超过1/4,遍历一遍后则可得到所求的3个ID。*/int main(int argc, char const *argv[]){int T1,T2,T3; //设置3个计时器int C1,C2,C3; //3个candidateint i;int const N = 20; //总帖子数T1 = 0,T2 = 0,T3 = 0;int a[N] = {1,1,4,3,1,1,2,2,3,3,4,1,2,1,2,3,3,3,2,2};for(i = 0; i < N; i++){if(T1 == 0 || C1 == a[i]) //计时器=0时,C1 = a[i],计数器+1;或者计数器不为0,C1 == a[i]时,前一句相当于没有改变,计数器+1{ C1 = a[i];T1++;}else if(T2 == 0 || C2 == a[i]){C2 = a[i];T2++;}else if(T3 == 0 || C3 == a[i]){C3 = a[i];T3++;}else //如果与三个candidate都不相同,三个计数器均-1{ T1--;T2--;T3--;}}cout<<"C1 :"< < <<"C2 :"< < <<"C3 :"< <