腾讯大数据开发实习面经

一面

2020年4月23日

自我介绍。

Spark和Hadoop的区别

MR流程、RDD流程

new malloc区别 epoll原理看过吗?讲一下多态

写到算法题吧:二分查找,写一下旋转数组最小值(又是这道题。我说这道题之前做过,面试官没再让我写)。

二面

2020年4月28日

自我介绍、在家里?没开学?

学过Hadoop,讲一下MR流程。说一下Partition分区的优化是怎么做的(Partition没答出来)

MR会有数据倾斜,讲一下如何解决(说了一些方法,被要求说的更详细一些。比如为什么增加Reduce数量就可以提高效率,如何自定义分区,如何重新设计key)

然后问的是Hadoop Streaming (没听说过,讲了下spark streaming

看简历上有个socket项目,问如何讲一下流程,问如何从socket中提取数据(时间太长,完全记不清了)

写个算法题。给一个树,每个节点的val都有取或不取两种状态。限定条件是,直接连接的节点不能同时取或者不取(比如父子节点) 想的是分成四次递归。问如何剪枝。没答出来

上面那个题没想法了。那咱们换个,给一个二叉树和两个节点 a ,b 找出二叉树的最近公共祖先。(剑指offer原题 最后一题)

平时大部分都是Py Java Scala开发,很少用C++,就很难受。还需要多学习啊。

关注我的公众号【互联网校招面经】

每天精选分享高质量的互联网初级面试经验。

每月月底会替大家总结这个月的面经汇总pdf版免费分享给大家。

每季度会推出针对具体岗位的面经汇总版本直接领取。

还会按照公司对优质面经进行分类整理直接奉送。

辛苦整理不易,帮忙点个赞呗,看见你们的回复是我继续努力的最大动力!!

原文地址:https://www.cnblogs.com/hulianwangmianjing/p/13298420.html