面试记录

1.美团

一面: 

  1)一个数组,给出一个值m,用最快的速度找出数组中两个数和为m的数。

  2)标准差和方差区别

  3)相似度,相关度,距离

  4)平时遇到的问题,遇到问题怎么办,平时怎么学习的,学的最好的一门课程,怎么学的。

  5)有什么需要问的。

2.CVTE  ----2017年9月14日(中央研究院-数据挖掘)

一面:

  1)介绍研究生工作,就项目提问。

  2)说下最熟悉的机器学习算法,我说kmeans,然后让解释什么是K-means

  3)解释下kmeans和dbscan的关系

  4)决策树属于判别模型还是生成模型?朴素贝叶斯呢?

  5)Batch Normalization作用

  6)dropout层有什么作用

  7)决策树中ID3、C4.5、Cart有什么区别?

  8)随机森林相关的问题,忘了具体怎么问的,我不会

 

3.链家-----2017年9月15日(数据挖掘)

  一开始来一个小时的现场笔试,五道题:redo和undo简单介绍;两棵树的最近公共子节点;取球问题;算法思路和复杂度的题,具体忘了;

1).自我介绍,就提到的项目提问

2).距离计算方法有哪些?                          (欧氏距离;曼哈顿距离,即两个坐标差值的绝对值之和;夹角余弦距离;相关距离,根据相关系数理论来的)

3).特征工程做过吗?(将数据属性转化为数据特征的过程,属性代表了数据的所有维度,在数据建模时,如果对原始数据的所有属性进行学习,并不能很好的找到数据的潜在趋势,而通过特征工程对数据进行预处理,使用的算法模型能够减少受到噪音的干扰,这样能更好地找到趋势。事实上,好的特征甚至能帮助使用简单的模型达到很好的效果)

4).讲讲随机森林和gbdt

5).手写一个MapReduce程序

6)。手写一个查找两个树是否结构和值一样。(面试官最开始希望看到递归的做法,最后他们透露的)

7)、kmeans和dbscan区别

8).激励函数sigmoid(只有正激励,有区间),tanh(有正负激励,有区间),relu区别

9)baging和boosting区别

特征工程常用方法:

 4.腾讯-----2017年9月22日

一面:

  1)自我介绍,对项目提问

  2)有序数组,输出连续出现次数大于K的所有数

  3)真的忘记了

5.顺丰----207年9月23日

一面:

  1)自我介绍,各种问项目

  2)介绍下CNN

  3)介绍LSTM,LSTM与RNN区别,现场画

  4)如何防止过拟合

  5)激活函数有哪些?什么作用

  6)会用Python吗?用过哪些包?   --TensorFlow,karas,sklearn等

  7)介绍Apriori算法,结合我的项目来说

  8)还用过哪些机器学习算法?  

  9)你的优点是什么?

hr面:(不愉快的面试)

  1)自我介绍,简单问了下项目

  2)最大优点是什么?你有别人没有的

  3)有什么要问的?

6.华为-----2017年9月26

  1)Java容器有哪些

  2)数据正负样本不平衡怎么解决

  3)如何处理数据异常值或者确实值

  4)如何做特征选择

  5)又不记得了。。。

几个经典问题整理:

  1)请说一下PCA原理

  2)解释一下SVM核函数的定义与意义

  3)阐述一下L1正则和L2正则的区别

  4)LR可以作为线性分类器吗?

原文地址:https://www.cnblogs.com/xunyingFree/p/7491690.html