记阿里面试题

1.LDA算法思想及工作流程,包括讲讲其中细节,如何抽取主题模型 
2.PLSA算法思想 
3.贝叶斯分类器如何工作 
4.为什么贝叶斯计算要定义特征之间是相互独立的 
5.K-means算法的原理和时间复杂度,这个算法一般要运行多少次才收敛 
6.基于用户的协同过滤算法如何计算用户相似度,基于item的协同过滤算法如何计算item的相似度 
7.如何处理大数据量的相似度计算 
8.给出两个查询词,如何通过搜索引擎得到两个词的相似度,如果搜索引擎的搜索结果不可靠该用什么方法计算,不考虑语义。 
9.在微博博文里如何计算两篇博文的相关度 
10.C++中虚函数的实现机制,编译器都做了什么 
11.C++中inline和define的区别 
12.C++中static的作用 
13.给定一个文档,找出在100w条文档中与其相似度最大的50个文档 
14.Hadoop分布式处理大数据时候,是否知道索引怎么用?知道XXX索引么?其中的原理是什么?(根本听不清XXX是啥,更谈不上原理了) 
15.给定1-100个数,从中挖出其中的两个,如何找到这两个值? 
16.青蛙跳楼梯,一跳可以一级也可以两级,问跳N级楼梯可以有多少种跳法? 
17.请问3个圆圈能在平面上得到多少个空间?后面问如果是4个呢? 

原文地址:https://www.cnblogs.com/ahujack/p/3096177.html