百度大搜 算法的实习

百度大搜 rank实习一面

面了2个小时,面到怀疑人生。

算法题: 

  • 手写快排
  • .最长公共子串

懵逼的题:

  • learn2rank
  • 短串匹配:有一些短串,如 杨幂 刘翔 (几万),还有很多query(几亿),比如刘翔夺冠(命中),刘夺冠(没命中),删除没命中的query。

               字典树+KMP字符串匹配(ac自动机)

      将 几万短串 构建一颗trie树,然后依次将query进行多模匹配(ac自动机)

  • 点击率特征如何设计?

clicks/views   

需要注意 1/1 这种点击率为1的情况,如果view很小的话,可能点击率比较大,比如说1个人看到了1个人点击,点击率是100%。

背诵题:

  • 特征选择方法?
  • CNN RNN区别?
  • TFIDF?
  • LR GBDT特征注意事项?

    归一化,缺失值,onehot

  • 深度学习避免过拟合?

    dropout BN .L1 L2

贴几个别人的面经,没答上来的题竟然在别人面经里!!!

https://www.cnblogs.com/qscqesze/p/6509450.html

https://blog.csdn.net/hopeztm/article/details/7818775

https://blog.csdn.net/koudaidai/article/details/7620190

 百度大搜 网页搜索部一面

20180509

图片搜索应该 挂了,今天又面了个网页搜索部,估计也是挂。。。

自我介绍。问我NLP是怎么学的?研究方向是啥,导师啥的

2道算法题

1、判断链表是否回文

2 剑指第一题

题目不难,自己答得太烂了, 回文那个链表逆转没写好,奇偶也没判断。

第二题思路是对的,但是不是面试官想要的答案,面试官也一直想说我的思路是错的,结果就gg

总结:之前面的算法题都没有思路,现在有思路了却写不出来,真的不能背题,怎也也得自己手写一遍,最好是在纸上画画,另外写代码的时候可以一遍写一遍讲讲?

 百度核心搜索部 

一面:

项目介绍
GBDT树特征重要性如何计算
learn2rank point wise par wise 区别

c++ static 关键字

算法题:

无序数组找出中位数
对只含1-n的n数组排序。

一面面试官超级好,会不断的提醒你,


二面:
L1 L2正则化区别,应用场景
树模型如何控制过拟合
树模型调参经验

二面答得不是很好,会冷场哦。

PS:他们主要做leran2rank 深度学习传统学习都会用。

原文地址:https://www.cnblogs.com/zle1992/p/8849567.html