第三十八题汇总 【微软面试100题 第三十八题】

第一题:

  用天平(只能比较,不能称重)从一堆小球中找出其中唯一一个较轻的,用x次天平,最多可以从y个小球中找出较轻的那个,求y与x的关系式。

分析:

  y = 3^x.

  例如:Y= 9.

      先分成3堆abc,每堆3个小球;

      第一次称找出在abc中哪一堆:称a和b,如果天平不倾斜,则a和b一样重,较轻的一个球肯定在c堆中,否则就在ab中较轻的一堆中;

      第二次称找出具体是哪个:假设第一称测出在a堆中,a堆中有3个球xyz,称x和y,如果一样重,则轻的为z,否则就为x和y中较轻的那个。

  又如Y = 81.

      先分成3堆abc,每堆27个小球;

      第一次称,分出轻的在abc哪一堆中(每堆27个),然后把该堆分成3堆xyz,每堆9个;

      第二次称,分出轻的在xyz哪一堆中(每堆9个),然后把该堆分成3堆mno,每堆3个;

      第三次称,分出轻的在mno哪一堆中(每堆3个),然后进行第四次;

      第四次称,分出该堆中轻的哪个,结束。

-----------------------------------------------------------------------------------------

第二题:

  有一个很大很大的输入流,大到没有存储器可以将其存储下来,而且只输入一次,如何从这个输入流中随机取得m个记录。

分析:

  用大小为m的数组arr[0:m-1]来保存随机抽取的元素,,arr[0:m-1]逐步初始化为输入流的前m个元素的一个随机排列。对于输入流中第k个(k>m)元素,随机生成[0,k-1]内的整数i,如果i<=m,则由第k个元素覆盖掉arr[i-1],否则就丢弃掉第k个元素。

  参考链接:http://blog.csdn.net/jiyanfeng1/article/details/7937715

-----------------------------------------------------------------------------------------

第三题:

  大量的url字符串,如何从中去除重复的,优化时间空间复杂度。

分析:

  1.如果内存空间足够把字符串一次存入内存中,则使用hash_map<string,bool>;

  2.如果内存空间不足够把字符串一次存入内存中,则先用hash的方法把这些字符串分配到n个硬盘空间,保证每个空间能够一次读入内存中,之后再采取1中的方法hash_map<string,bool>.

  

原文地址:https://www.cnblogs.com/tractorman/p/4078463.html